Gene GM21_1368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1368
Symbol
ID	8136696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1612778
End bp	1614433
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	62%
IMG OID	644868982
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_003021185
Protein GI	253699996
COG category	[T] Signal transduction mechanisms
COG ID	[COG4251] Bacteriophytochrome (light-regulated signal transduction histidine kinase)
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.00000126937
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAAGACG AGCTGACGCC GGAGCTGCGG GACGAACTAC CGAAGGCTCC AAAGGACATC 
CCCGGGCTGG ATCCGAAGGC CACACTGTTG CTGCAGGATC TGCAGAGCAG GCTGGCGACG 
GCCGAGGCCG AGAATGTACG GTTGCGCCGC GTCATCGAAT CCCAGCGCTG CGACGAGGAT 
GGTTACCGCT TCCTCTACAA CGACACCCCG GTCATGCTGC ACTCCATCGA CCGCAACGGG 
CTGCTCCTGG GAGTGAGCAA CTATTGGGTC GAGGTGCTGG GGTACCAGCG GGAGGAGGTG 
ATCGGGCGCA AGTCGACCGA TTTCCTTACC GAGGAGTCGC GCCGCTACGC CGAAGAGGTC 
GTCCTGCCCG AGTTCTTCCG CACCGGTTTT TGCCGCAACG TCCATTATCA GATGGTGAAA 
AAGAGCGGGG AGCTCCTGGA CGTGCTTCTT GTCGCCTCCG CGGAGCGGGG ACCCCGGGGT 
GAACTGCTGC GCTCCTTTGC CGTCATGACC GACGTGACAG AATGGAAGGC TGCGGAAAAG 
GCTTTGAAGG AGAGCGAAGA GCGCTACCGC ATGATAGTAG AGACCTCCCA AGAGGGGATA 
CTCGCGGTCG ATGCCGAGGG GCGCATAAGC TACGCCAACC GTCAGTTCGC CGAGATGCTG 
GGGCTGGAGG TCGGCGAGGT CGGCGAGGTC GGCGAGGTCG TCGGGCGTTT TTTCCTTGAG 
TTCGTCGACG GCTGCCTGCA CGACGATGTA GCCGTCAAGA TCAAGAACCG GGAAAATGGG 
CTATCCGAGC ATTACGAGAC GATCTTGCTG CGCAAGGGGG GCTCCAGGAT GTGGGCCGGC 
GTCTCCGCCA TTCCCGTAAA AGGCCCAAAC GGCGAGTTCT CCGGGGCGTT CGCCATGGTC 
TCCGACATCA CCAAGCGCAA ACAGGCTGCC GAGGAGATCG AGGTGCTGCA CACACATCTT 
TCGGCGCGCG CCTGCGAACT GGAGCTTGCC AACGAGGAGT TGGAGGCTTT CAGCTACACC 
GTTTCCCACG ACCTCAGAAG GCCTCTCACC GCCATAAACG GCTTCAGCCA GGTGCTGCTC 
GAGCTTTACG GATCCGGTAT GGACCCGCAG TGCAGGGAGT ACGTACGGGA GATCCTAAAC 
GGCAGCATCA GGATGAACCA CCTGATCGAC ACGCTGATCA ACTTCTCGCG CCGAAGCGGA 
GGAGAATCGG TCCGGGAAGA GGTGGAGATA ACCGAGCTGG TGGAGGAACT TTGCGCCGAA 
CTGCAACGCA CCGAGCCTCA GCGCAACGTT TCCCTGCTCA TCCAGCCAGG CGTGCGCGGG 
ATGGCCGACG CGCATCTTTT GCGGGTCGTC CTCGACAACC TGCTGGGGAA CGCCTGGAAG 
TACTCCGCCA AAATGGAGTC AAGCGAGATC GCATTCGGCA CGGTCGATCA CCTGGGGAAG 
ACGGCCTACT TCGTCCGGGA CAACGGCGCA GGTTTCGACA TGGCCCTGGG TGACCTGCTG 
TTCAAGCCGT TCCAGCGCCT CCACGACGCC CGCGATTTCG AAGGGACCGG CATCGGCCTC 
GCCAGCGTGC AGCGCATCAT TCAGCGGCAC GGGGGGCAGA TCTGGGCCGA GAGCGAACCC 
GGCAAAGGGG CGACCTTCTA CTTCACCCTG GGCTAG

Protein sequence

MQDELTPELR DELPKAPKDI PGLDPKATLL LQDLQSRLAT AEAENVRLRR VIESQRCDED 
GYRFLYNDTP VMLHSIDRNG LLLGVSNYWV EVLGYQREEV IGRKSTDFLT EESRRYAEEV 
VLPEFFRTGF CRNVHYQMVK KSGELLDVLL VASAERGPRG ELLRSFAVMT DVTEWKAAEK 
ALKESEERYR MIVETSQEGI LAVDAEGRIS YANRQFAEML GLEVGEVGEV GEVVGRFFLE 
FVDGCLHDDV AVKIKNRENG LSEHYETILL RKGGSRMWAG VSAIPVKGPN GEFSGAFAMV 
SDITKRKQAA EEIEVLHTHL SARACELELA NEELEAFSYT VSHDLRRPLT AINGFSQVLL 
ELYGSGMDPQ CREYVREILN GSIRMNHLID TLINFSRRSG GESVREEVEI TELVEELCAE 
LQRTEPQRNV SLLIQPGVRG MADAHLLRVV LDNLLGNAWK YSAKMESSEI AFGTVDHLGK 
TAYFVRDNGA GFDMALGDLL FKPFQRLHDA RDFEGTGIGL ASVQRIIQRH GGQIWAESEP 
GKGATFYFTL G