Gene GM21_3930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3930
Symbol
ID	8139304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4514665
End bp	4515693
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	64%
IMG OID	644871547
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_003023705
Protein GI	253702516
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	0.0182336
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGAGG AACCTGAAAA AATCGCGGCC ATGCTGCTGG AGCGGATCGA CTGCGGCGTC 
GTGCATCTGG ACGACACCGG AAAGGTGCTC CTCGTCAACA GCAAGGCGGA AGAATTGCTT 
CACGTCCAGC GCGGCCAGGT GCTGGGGCGC AGGGTCGACA TGCTCCCCTT GCGCACCCCG 
CTTTACCGTG TGCTGAGCGA GGACTCGCGG GACGCCCCGG TGGAGATGAG CTTGGAAGGG 
ACGGTGGTCC AGGTCCGCTC CTTCGGCCTG CCGGCCGAGT GCGGCGGAGG GGAGCTGTAC 
CAGCTTCGCG ACGTAACCGC TGAAAGAAAG GAGAGGCGGC AGCGCGAGGA GTTCGTGGCC 
ATGATGACCC ACGACCTCAA GTCGCCGCTC ACCGTGATCA TGGGGTACAT CCAGGCCCTT 
TTGGGGGAAA AGGCGAAGAT CGACCCCTCG CTGCACCTGT TCCTCGGGGA GATGGACAAA 
AGTTCGGTGA AGATGCTCTC CATGATCGAC GACGTGCTGG ACGCCTACCG GCTGGAGGCG 
GGCCTTTTGC AGATCGACCG CCGCCGCTGC GACATCCACC CCTTGCTGGA GGGTTGCAGC 
CGCGACGGCG AGCGCGAGGC GGCGGTGCAC GGCTCCTGCT TCCAAAGCGA GCTCTGCGAC 
GACATCCCCC CGCTGGAACT CGACGCGAAG CAGATCAGCC GGGTCTTCGC CAACCTGATC 
GGCAACGCGG TGAAATTCAC CCCCAGGCGC GGCACCATCA CCTTCAGCAG CGAGGTCCGG 
GACGGGTTTC TCCGGGTTCA GGTCGCCGAT ACCGGCATCG GGATTCCGCC CGAGGAGCTG 
CCGCGGATCT TCAACCAGTA TTTCCGGGCC CAGTCGGCGC ACGGTTTCAA GGGGACGGGG 
CTTGGCCTCA CCATCAGCAA GGCGATCGTG GAAGCCCACG GCGGCAGCAT CGGCGTGGAG 
AGCACGGCCG GCAAGGGGAG CCGCTTCTCG GTCCTTTTGC CGCTGCAGGA GAAAAAGGAA 
GTCATTTAA

Protein sequence

MQEEPEKIAA MLLERIDCGV VHLDDTGKVL LVNSKAEELL HVQRGQVLGR RVDMLPLRTP 
LYRVLSEDSR DAPVEMSLEG TVVQVRSFGL PAECGGGELY QLRDVTAERK ERRQREEFVA 
MMTHDLKSPL TVIMGYIQAL LGEKAKIDPS LHLFLGEMDK SSVKMLSMID DVLDAYRLEA 
GLLQIDRRRC DIHPLLEGCS RDGEREAAVH GSCFQSELCD DIPPLELDAK QISRVFANLI 
GNAVKFTPRR GTITFSSEVR DGFLRVQVAD TGIGIPPEEL PRIFNQYFRA QSAHGFKGTG 
LGLTISKAIV EAHGGSIGVE STAGKGSRFS VLLPLQEKKE VI