Gene EcSMS35_4109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4109
Symbol	gidA
ID	6146368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4203543
End bp	4205432
Gene Length	1890 bp
Protein Length	629 aa
Translation table	11
GC content	55%
IMG OID	641618933
Product	tRNA uridine 5-carboxymethylaminomethyl modification enzyme GidA
Protein accession	YP_001746071
Protein GI	170680590
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG0445] NAD/FAD-utilizing enzyme apparently involved in cell division
TIGRFAM ID	[TIGR00136] glucose-inhibited division protein A

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0017161
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.124027
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTATC CGGATCCTTT TGACGTCATC ATCATTGGCG GGGGTCATGC AGGCACCGAG 
GCCGCGATGG CCGCGGCGCG TATGGGTCAA CAGACTCTGC TTTTGACACA CAATATCGAC 
ACTCTGGGGC AGATGAGCTG CAACCCGGCG ATCGGCGGTA TTGGGAAGGG ACATCTGGTA 
AAAGAAGTGG ATGCACTCGG CGGTCTGATG GCGAAAGCGA TCGATCTGGC GGGTATCCAG 
TTTAGGATAC TAAACGCAAG TAAGGGACCG GCAGTTCGCG CTACCCGAGC TCAGGCGGAT 
CGTGTGCTCT ACCGGCAGGC GGTACGTACG GCGCTGGAGA ACCAACCGAA CCTGATGATC 
TTCCAGCAGG CAGTTGAAGA TCTTATTGTC GAAAACGATC GCGTGGTCGG AGCCGTTACC 
CAAATGGGAC TGAAGTTCCG TGCCAAAGCT GTCGTGCTCA CCGTTGGGAC GTTCCTCGAC 
GGTAAAATTC ATATCGGTCT GGATAACTAC AGCGGTGGCC GTGCTGGTGA TCCGCCGTCC 
ATTCCGCTTT CTCGCCGTTT GCGTGAACTG CCGCTGCGCG TTGGTCGTCT GAAAACCGGG 
ACACCACCGC GTATTGATGC TCGAACCATC GACTTTAGCG TACTGGCGCA ACAGCATGGC 
GATAACCCAA TGCCGGTATT CTCGTTTATG GGCAATGCGT CCCAGCATCC CCAGCAGGTG 
CCGTGTTATA TCACTCATAC CAACGAGAAA ACCCATGATG TGATCCGCAG TAACCTCGAT 
CGTAGCCCAA TGTACGCAGG GGTGATCGAA GGTGTCGGCC CACGCTACTG CCCGTCGATC 
GAAGACAAAG TCATGCGCTT CGCCGACAGA AATCAGCATC AGATCTTCCT TGAACCGGAA 
GGGCTGACCT CTAACGAAAT TTATCCGAAC GGTATCTCCA CCAGCCTGCC GTTCGATGTG 
CAGATGCAAA TCGTCCGCTC CATGCAGGGG ATGGAAAACG CGAAGATCGT GCGTCCGGGT 
TATGCCATTG AGTATGACTT CTTCGATCCA CGCGACCTGA AACCGACGCT GGAGAGCAAG 
TTTATCCAGG GGCTGTTCTT TGCTGGTCAG ATTAACGGCA CTACCGGTTA CGAAGAAGCC 
GCTGCGCAAG GTTTGCTGGC TGGTCTTAAC GCTGCCCGTC TGTCTGCAGA CAAAGAAGGT 
TGGGCTCCGG CGCGTTCTCA GGCGTATCTC GGCGTACTGG TTGATGACCT GTGCACTTTA 
GGAACCAAAG AACCGTATCG TATGTTTACC TCGCGCGCAG AATATCGTCT GATGCTGCGC 
GAAGATAATG CGGATCTGCG TTTGACTGAA ATCGGTCGTG AACTGGGCCT GGTGGATGAC 
GAACGTTGGG CGCGCTTTAA CGAGAAACTT GAGAATATCG AGCGTGAGCG TCAGCGTCTG 
AAATCGACCT GGGTAACCCC GTCGGCGGAA GCTGCAGCCG AAGTGAATGC TCACCTGACT 
GCGCCACTTT CCCGTGAAGC CAGTGGTGAA GATCTGCTGC GTCGTCCGGA AATGACTTAT 
GAAAAATTAA CCACGCTGAC GCCGTTTGCC CCTGCGTTGA CAGACGAACA GGCGGCGGAA 
CAGGTTGAGA TTCAGGTTAA ATACGAAGGT TATATCGCGC GCCAGCAAGA TGAGATCGAA 
AAGCAGCTGC GTAACGAGAA CACCCTGCTA CCAGCGACGC TGGATTACCG CCAGGTATCC 
GGTCTTTCTA ACGAAGTGAT CGCCAAACTT AACGATCACA AACCGGCCTC TATCGGTCAG 
GCTTCGCGTA TTTCTGGCGT CACGCCTGCG GCCATCTCCA TTCTGCTGGT GTGGCTGAAA 
AAACAGGGTA TGCTGCGTCG TAGCGCATAA

Protein sequence

MFYPDPFDVI IIGGGHAGTE AAMAAARMGQ QTLLLTHNID TLGQMSCNPA IGGIGKGHLV 
KEVDALGGLM AKAIDLAGIQ FRILNASKGP AVRATRAQAD RVLYRQAVRT ALENQPNLMI 
FQQAVEDLIV ENDRVVGAVT QMGLKFRAKA VVLTVGTFLD GKIHIGLDNY SGGRAGDPPS 
IPLSRRLREL PLRVGRLKTG TPPRIDARTI DFSVLAQQHG DNPMPVFSFM GNASQHPQQV 
PCYITHTNEK THDVIRSNLD RSPMYAGVIE GVGPRYCPSI EDKVMRFADR NQHQIFLEPE 
GLTSNEIYPN GISTSLPFDV QMQIVRSMQG MENAKIVRPG YAIEYDFFDP RDLKPTLESK 
FIQGLFFAGQ INGTTGYEEA AAQGLLAGLN AARLSADKEG WAPARSQAYL GVLVDDLCTL 
GTKEPYRMFT SRAEYRLMLR EDNADLRLTE IGRELGLVDD ERWARFNEKL ENIERERQRL 
KSTWVTPSAE AAAEVNAHLT APLSREASGE DLLRRPEMTY EKLTTLTPFA PALTDEQAAE 
QVEIQVKYEG YIARQQDEIE KQLRNENTLL PATLDYRQVS GLSNEVIAKL NDHKPASIGQ 
ASRISGVTPA AISILLVWLK KQGMLRRSA