Gene EcDH1_1202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1202
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1298237
End bp	1300216
Gene Length	1980 bp
Protein Length	659 aa
Translation table	11
GC content	56%
IMG OID
Product	glutamate synthase, small subunit
Protein accession	ACX38876
Protein GI	260448454
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCGTT TTATTATGGC CAACAGTCAG CAATGTCTGG GTTGTCATGC TTGTGAAATC 
GCCTGTGTCA TGGCTCACAA TGATGAGCAA CATGTCCTGA GCCAACACCA TTTTCATCCC 
CGAATTACGG TTATCAAACA TCAACAGCAA CGTAGTGCAG TGACCTGTCA CCATTGTGAA 
GATGCGCCCT GCGCCCGTAG CTGCCCTAAT GGCGCAATCA GCCACGTTGA TGACAGCATT 
CAGGTCAATC AGCAAAAGTG TATTGGCTGT AAATCCTGCG TGGTGGCCTG TCCTTTTGGT 
ACGATGCAAA TCGTCCTGAC ACCCGTCGCG GCAGGAAAAG TAAAAGCCAC GGCGCATAAA 
TGCGACCTTT GTGCGGGGCG CGAAAACGGT CCTGCCTGTG TTGAGAATTG CCCGGCGGAC 
GCGCTGCAAC TGGTCACTGA CGTCGCACTC TCCGGCATGG CGAAATCCCG CCGCTTGCGC 
ACCGCGCGTC AGGAACATCA ACCGTGGCAT GCCAGTACCG CGGCGCAAGA AATGCCGGTA 
ATGAGTAAAG TCGAACAAAT GCAGGCAACG CCCGCGCGTG GCGAGCCGGA TAAACTGGCG 
ATTGAAGCGC GCAAAACCGG TTTTGATGAA ATTTATCTGC CATTTCGCGC CGACCAGGCA 
CAACGGGAAG CCTCGCGCTG CCTTAAGTGC GGCGAGCACA GCGTTTGTGA ATGGACCTGC 
CCGCTGCATA ACCATATACC GCAGTGGATT GAACTGGTGA AAGCCGGAAA CATCGACGCC 
GCCGTCGAGC TTTCTCACCA GACCAACACC CTGCCGGAAA TTACCGGACG CGTTTGTCCG 
CAAGACCGTT TGTGTGAAGG TGCCTGTACT ATTCGCGATG AGCACGGCGC GGTAACTATC 
GGCAACATTG AACGCTACAT TTCAGATCAG GCGTTGGCGA AAGGTTGGCG TCCTGACTTA 
AGCCATGTCA CCAAAGTGGA CAAGCGGGTG GCGATTATCG GTGCAGGTCC GGCAGGGCTG 
GCCTGTGCGG ATGTTCTGAC CCGCAATGGC GTGGGGGTGA CGGTGTACGA TCGCCATCCA 
GAAATCGGTG GCTTGCTCAC TTTCGGCATT CCTTCTTTCA AACTGGATAA ATCCCTGCTG 
GCACGCCGTC GGGAAATCTT CAGCGCGATG GGGATTCACT TCGAACTCAA TTGTGAAGTG 
GGTAAAGATG TCTCTTTGGA TTCGCTTTTG GAACAATACG ACGCGGTCTT CGTTGGCGTA 
GGCACTTACC GTTCCATGAA AGCGGGTTTA CCCAATGAAG ATGCGCCGGG CGTTTATGAC 
GCGCTGCCGT TCCTCATTGC CAACACTAAA CAGGTGATGG GGCTCGAAGA GCTACCGGAA 
GAGCCGTTTA TCAATACCGC CGGACTTAAC GTCGTGGTAC TGGGCGGCGG CGACACCGCG 
ATGGACTGTG TGCGTACCGC ACTGCGCCAC GGCGCGAGTA ACGTCACCTG CGCTTATCGT 
CGTGATGAAG CTAACATGCC AGGCTCGAAG AAAGAAGTGA AGAACGCCCG CGAAGAGGGG 
GCCAACTTCG AATTTAACGT CCAGCCGGTG GCGCTTGAGC TGAATGAACA AGGTCACGTC 
TGCGGGATTC GTTTCCTGCG CACGCGTCTT GGAGAGCCGG ATGCCCAGGG GCGTCGGCGT 
CCAGTGCCGG TGGAAGGCAG TGAATTTGTC ATGCCAGCCG ACGCGGTGAT TATGGCGTTT 
GGCTTCAATC CGCACGGGAT GCCGTGGCTG GAGTCGCACG GTGTAACGGT AGACAAATGG 
GGCCGCATCA TCGCGGATGT GGAAAGCCAG TACCGTTACC AGACCACCAA TCCGAAAATC 
TTCGCTGGTG GTGACGCCGT GCGTGGTGCG GATCTGGTGG TTACCGCAAT GGCAGAAGGA 
CGTCATGCGG CACAGGGGAT TATTGACTGG CTGGGGGTAA AATCAGTCAA ATCTCACTGA

Protein sequence

MNRFIMANSQ QCLGCHACEI ACVMAHNDEQ HVLSQHHFHP RITVIKHQQQ RSAVTCHHCE 
DAPCARSCPN GAISHVDDSI QVNQQKCIGC KSCVVACPFG TMQIVLTPVA AGKVKATAHK 
CDLCAGRENG PACVENCPAD ALQLVTDVAL SGMAKSRRLR TARQEHQPWH ASTAAQEMPV 
MSKVEQMQAT PARGEPDKLA IEARKTGFDE IYLPFRADQA QREASRCLKC GEHSVCEWTC 
PLHNHIPQWI ELVKAGNIDA AVELSHQTNT LPEITGRVCP QDRLCEGACT IRDEHGAVTI 
GNIERYISDQ ALAKGWRPDL SHVTKVDKRV AIIGAGPAGL ACADVLTRNG VGVTVYDRHP 
EIGGLLTFGI PSFKLDKSLL ARRREIFSAM GIHFELNCEV GKDVSLDSLL EQYDAVFVGV 
GTYRSMKAGL PNEDAPGVYD ALPFLIANTK QVMGLEELPE EPFINTAGLN VVVLGGGDTA 
MDCVRTALRH GASNVTCAYR RDEANMPGSK KEVKNAREEG ANFEFNVQPV ALELNEQGHV 
CGIRFLRTRL GEPDAQGRRR PVPVEGSEFV MPADAVIMAF GFNPHGMPWL ESHGVTVDKW 
GRIIADVESQ YRYQTTNPKI FAGGDAVRGA DLVVTAMAEG RHAAQGIIDW LGVKSVKSH