Gene EcolC_1337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1337
Symbol
ID	6068235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1467981
End bp	1469249
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	56%
IMG OID	641600759
Product	bifunctional folylpolyglutamate synthase/ dihydrofolate synthase
Protein accession	YP_001724330
Protein GI	170019376
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.887259
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTATCA AACGCACTCC TCAAGCCGCG TCGCCTCTGG CTTCGTGGCT TTCTTATCTG 
GAAAACCTGC ACAGTAAAAC TATCGATCTC GGCCTTGAGC GCGTGAGCCA GGTCGCGGCG 
CGTCTTGGCG TCCTGAAACC AGCGCCATTT GTGTTTACCG TTGCGGGTAC GAATGGCAAA 
GGCACCACCT GCCGTACGCT GGAGTCGATT CTGATGGCGG CAGGGTACAA AGTGGGCGTC 
TACAGTTCAC CGCATCTGGT GCGTTATACC GAGCGCGTAC GTGTGCAGGG GCAGGAATTG 
CCGGAATCGG CCCACACCGC CTCTTTTGCG GAGATTGAAT CGGCACGCGG TGATATTTCC 
CTGACCTATT TCGAGTACGG TACGCTGTCG GCGTTGTGGC TGTTCAAACA GGCACAACTT 
GACGTAGTGA TTCTGGAAGT AGGGCTGGGC GGTCGTCTGG ACGCAACCAA TATTGTCGAT 
GCCGATGTGG CTGTAGTAAC CAGCATTGCG CTGGATCATA CCGACTGGCT GGGACCAGAT 
CGCGAAAGTA TTGGTCGCGA GAAAGCAGGC ATCTTTCGCA GCGCAAAACC GGCAATTGTC 
GGTGAGCCGG AAATGCCTTC TACCATTGCT GATGTGGCGC AGGAAAAAGG TGCACTGTTA 
CAACGTCGGG GCGTTGAGTG GAACTATTCC GTCACCGATC ATGACTGGGC GTTTAGCGAT 
GCTCACGGCA CGCTGGAAAA TCTGCCGTTG CCGCTTGTCC CGCAACCGAA TGCCGCAACA 
GCGCTGGCGG CACTGCGTGC CAGCGGGCTG GAAGTCAGTG AAAATGCCAT TCGCGACGGG 
ATTGCCAGCG CAATTTTGCC GGGACGTTTC CAGATTGTGA GCGAGTCGCC ACGCGTTATT 
TTTGATGTCG CGCATAATCC ACATGCGGCG GAATATCTCA CCGGGCGTAT GAAAGCGCTA 
CCGAAAAACG GGCGCGTGCT GGCGGTTATC GGTATGCTAC ATGATAAAGA TATTGCCGGA 
ACTCTGGCCT GGTTGAAAAG CGTGGTTGAT GACTGGTATT GTGCGCCACT GGAAGGGCCG 
CGCGGTGCCA CGGCAGAACA ACTGCTTGAG CATTTGGGTA ACGGCAAATC ATTTGATAGC 
GTTGCGCAGG CATGGGATGC CGCAATGGCG GACGCTAAAG CGGAAGACAC CGTGCTGGTG 
TGTGGTTCTT TCCACACGGT CGCACATGTC ATGGAAGTGA TTGACGCGAG GAGAAGCGGT 
GGCAAGTAA

Protein sequence

MIIKRTPQAA SPLASWLSYL ENLHSKTIDL GLERVSQVAA RLGVLKPAPF VFTVAGTNGK 
GTTCRTLESI LMAAGYKVGV YSSPHLVRYT ERVRVQGQEL PESAHTASFA EIESARGDIS 
LTYFEYGTLS ALWLFKQAQL DVVILEVGLG GRLDATNIVD ADVAVVTSIA LDHTDWLGPD 
RESIGREKAG IFRSAKPAIV GEPEMPSTIA DVAQEKGALL QRRGVEWNYS VTDHDWAFSD 
AHGTLENLPL PLVPQPNAAT ALAALRASGL EVSENAIRDG IASAILPGRF QIVSESPRVI 
FDVAHNPHAA EYLTGRMKAL PKNGRVLAVI GMLHDKDIAG TLAWLKSVVD DWYCAPLEGP 
RGATAEQLLE HLGNGKSFDS VAQAWDAAMA DAKAEDTVLV CGSFHTVAHV MEVIDARRSG 
GK