Gene GM21_2068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2068
Symbol
ID	8137404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2396617
End bp	2398875
Gene Length	2259 bp
Protein Length	752 aa
Translation table	11
GC content	61%
IMG OID	644869683
Product	PAS/PAC sensor hybrid histidine kinase
Protein accession	YP_003021878
Protein GI	253700689
COG category	[T] Signal transduction mechanisms
COG ID	[COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR01435] glutamate--cysteine ligase/gamma-glutamylcysteine synthetase, Streptococcus agalactiae type

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.0000000000000882027
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGAGCC GCCTCGAAGT AAAGATCATC GTCTCCCTCG CCCTCATCCT GACCTTGCTC 
ATCGCCGTTT ACGGCTGGTG GATCGGCAGC CGGCAGACCT CTGTCTACAT TCAGACCCTC 
TCCGACAACC TGCGCATCCT CTCCCGCAGC AACGCCGACC ACGCGGCAAA TTTCATGGTG 
ATAAAGGAAT ACGCCGGGTT GGAAGCGCAC ATGCTGGACA GCGCCAACCT CCCCGAGGTG 
GTCAACATCC AGGTCGCCGA ACAGGATGGG AACCTTCTGT GCAACATCGA TCGTCCCAAC 
CGCGCCGAGC TGCCCAAGGT GAACTACAAC GTCAAATGGG TCAGGGTGCC GCAGGGGTCC 
CAACCCGTTC TTAAACGCGA GGGACACCAA CTGGTGAGCT GGTGTCCCAT CGTCGCCGGC 
GAACAGCTTG GCTGGGTAAA AATCGTCCTG AGCCTGGATA CGGCGCAGCG CCTCCTGCAG 
GCCACCTGGC GCAGCACGCT TGTCATCGGC TTGCTCTGGA TCATCGTGGG AACCGTCCTG 
ATGGCCATGG TGGTCAAGCC GCCGCTTCGG GCGGTCCGGG AACTGAGCCG CTTCGCGGAC 
GAGCTGCAAA ACCGGAAGGG AGCGCAGGTC TCGGTGCCGC GCGGTGTGTA CGAAATCGAC 
ATGCTGGCGG ATGCCCTGAA TCATTCGTCT AGAGAACTCC TGCTGGCCGA GCAGCGCCTG 
TTAGCGGAAC AGGAACGCCT CTCCGTAACG CTGCAATCCA TCGGCGACGG CGTCATCGCC 
ACCGATACCG AGAGCAGAAT TGTGCTGGTC AACCACGTTG CCGAGCTTAT GACAGGCTGG 
ACCGAGAAAC AGGCCACAGG CGTAGGCCTG GACCAGGTTC TTTGCATCGA GCCAAGCGAC 
TCCCTCCCGG ACGTCCGGGA AGCGCTTCAG GCGGTGATGG AGCGAAGGCA GACCATAGAA 
CTCCCCGACC TGCACCGGGT GTGGTCCCGG GACGGCGTCT CCCGCACGGT AACCGTGATC 
GGCGCTCCCA TCATAGACAG CGCGGCCCGG CTGGCAGGTA TGGTGCTAGT GATCCGCGAC 
CTGACGGAGA AGGCGAAGAT GGAGGCCGAG AAGACGGGGC TTGCCGAGCA ACTGCTCCAG 
TCGCAGAAGA TGGAGGCGGT AGGCAAGCTG GCCGGAGGGG TGGCGCATGA TTTCAACAAC 
ATGCTGGGAG TCATCATAGG CAATGCCGAG CTGGCCATGA TGGGTGTCGA GCCTTCGGGG 
AAACTCCACG ACCGGCTGCA GGGGATCCTC GATGCCGCCA ACCGCTCCGC CGAGATCACC 
CGCCAGTTGC TGGCTTTCTC AAGGCAGCAG CACGCAGAGC CCAAGGTACT CGATCTGAAC 
GTAGTTATCG GCAAGATGCT GAAGATGCTG CACAGGCTGA TTGGCGAGGA TATCGAAGTC 
GTCTGGTCGC CGGGACAAGA CATCTGGAAA GTGAAACTGG ATCCGAGCCA GTTGGACCAG 
ATCATGGCCA ACCTCTGCGT CAACGCCAGG GACGCCATCG CAGGAATCGG GAGAATGGAC 
ATCCGGACGG AGAACGTCGA ATTGTCCCCT GAGAAACGAG GCCCTGCGGA GATGCCCCAG 
GGAAGGTGCG TGATGCTGGA GGTGAGCGAC AGCGGCTGCG GCATGAGGCG CGAGGTGATG 
GAAAGGATCT TCGAACCCTT CTATACGACA AAGGAAGTCG GGCGCGGAAC CGGGCTGGGA 
CTGGCGACCG TTTTCGGCAT CGTCAAGCAA AACGACGGGC ACATCGAGGT GCGGAGCGAG 
CCCGGGGCCG GTACCAGCTT CAGGCTCTAT TTCCCTGCGG TTGAGGGGGA AGCTCAGGAC 
CACAAGAAAG GGAGCGTCGC GGCGATCAGG GGGAACGAGA CCATACTCGT CGTGGAGGAC 
GAGCCGTCGA TCAATGCGCT CGCCACCACC ATGCTGTCGG AGTTGGGGTA CAGGGTTTTT 
TCAGCGGGGA CACCTGGCGA GGCAGTTAAG GTGGCGGACG GCGGCCAGGT GAAGATAGAC 
CTGTTGCTGA CGGATATAAT CATGCCTGAT ATGAACGGGC GCGACTTGTC CGAGTTGCTG 
CACCGGTCGC ATCCCGACAT GAAGTGCCTG TTCATGTCGG GGTATACCTC GGACATCATA 
TCGGAGCGTG GCAACATAGG GCGGGAGGTC TGTTTTCTGC AAAAGCCCTT CACCACCCAG 
ACGTTGGCGG CGAAGGTCAG AGAGGCGCTG CAGGCCTAG

Protein sequence

MTSRLEVKII VSLALILTLL IAVYGWWIGS RQTSVYIQTL SDNLRILSRS NADHAANFMV 
IKEYAGLEAH MLDSANLPEV VNIQVAEQDG NLLCNIDRPN RAELPKVNYN VKWVRVPQGS 
QPVLKREGHQ LVSWCPIVAG EQLGWVKIVL SLDTAQRLLQ ATWRSTLVIG LLWIIVGTVL 
MAMVVKPPLR AVRELSRFAD ELQNRKGAQV SVPRGVYEID MLADALNHSS RELLLAEQRL 
LAEQERLSVT LQSIGDGVIA TDTESRIVLV NHVAELMTGW TEKQATGVGL DQVLCIEPSD 
SLPDVREALQ AVMERRQTIE LPDLHRVWSR DGVSRTVTVI GAPIIDSAAR LAGMVLVIRD 
LTEKAKMEAE KTGLAEQLLQ SQKMEAVGKL AGGVAHDFNN MLGVIIGNAE LAMMGVEPSG 
KLHDRLQGIL DAANRSAEIT RQLLAFSRQQ HAEPKVLDLN VVIGKMLKML HRLIGEDIEV 
VWSPGQDIWK VKLDPSQLDQ IMANLCVNAR DAIAGIGRMD IRTENVELSP EKRGPAEMPQ 
GRCVMLEVSD SGCGMRREVM ERIFEPFYTT KEVGRGTGLG LATVFGIVKQ NDGHIEVRSE 
PGAGTSFRLY FPAVEGEAQD HKKGSVAAIR GNETILVVED EPSINALATT MLSELGYRVF 
SAGTPGEAVK VADGGQVKID LLLTDIIMPD MNGRDLSELL HRSHPDMKCL FMSGYTSDII 
SERGNIGREV CFLQKPFTTQ TLAAKVREAL QA