Gene Gura_4221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_4221
Symbol
ID	5164870
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	4880527
End bp	4881606
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	52%
IMG OID	640551699
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_001232937
Protein GI	148266231
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAA GCGGATTGAC ACATACGGGA TCTCCAAAAG AGGACGCTCT TTCTCTTTCC 
AATAGGTCTG CTATTGTCGG CATGCTTATG GACAGCGTAG GCATAGGCGT GATCTTTGTC 
GAGACCAGCG GACGACTTAC ACTCATCAAC CGCAAGGCCG AGGCAATACT GCAAGCCTCC 
GGCAGTTCCG TACTGGGCAA AAGGGTTGAT ATGCTGCCGC TGCGCACCGC TATTTACAAG 
GTTCTGAGTG AAGATTGCAG CGAGACTCCT GTTGAGATGA GCATTGACGG TGCGGTAATC 
ACCGTCAAAT CATCCGAATT ATATGCTCCT GACGGCGAAA TACTGGGAGA GATGTTCGAG 
TTGCGCGATG TTACCGAAGA TAAGAAAGAA AAGAGGCAGC GCGAAGAGAT AGTTGCCATG 
ATGACCCACG ATCTCAAGTC TCCATTGACG GTTTTGATGG GATACGTCCA GACGCTGAAG 
GGGGAAATGC CGCAAAAGAT CGACATTTCG CTTCAGCCTT GTCTGAAGGA GATGGACAGG 
AGCGCTCTAA AGCTTCTTGC CATGATAGAG GACGTCTTGG ACGCTTACCG GCTGGAGGTG 
GGTCTCCTGC AGATTAATTG TGCCGTCTGT GATATCGGCG CACTGCTTGA TGGGTGCTGC 
TGTGACGGAT TACGTGAAGC CCAGGCGCGC GGTTCGAATC TTACCTGTAA CATCAGTGAG 
GGGATTCCTC CTCTCAAGGT CGATGGCAAG CAGCTTTCAC GGGTCTTTGC CAACCTTATC 
GGCAATGCGT TGAAGTTTAC CCCTCGCCGC GGCTCAGTCA CGGTGACTGC TGAAGTGCGG 
GAGGATAAGG TTTTTGTTTC CGTTAAAGAT ACCGGGATCG GGATCCCGCA GAAAGATGTG 
CCGCGGATCT TTAACAAGTA TTTTCGATCC TCTGCCGCTA CCGGCTTCAA AGGGACCGGC 
CTTGGCCTGA CCATCAGTAA AGCTATTGTG GAAGCTCACA GCGGTACGAT CGAAGTTGAA 
AGTGTGGAGG GCGAAGGCAG CTGCTTTTCG GTCATCATTC CTCTGGGAGC CTGTCATTGA

Protein sequence

MEKSGLTHTG SPKEDALSLS NRSAIVGMLM DSVGIGVIFV ETSGRLTLIN RKAEAILQAS 
GSSVLGKRVD MLPLRTAIYK VLSEDCSETP VEMSIDGAVI TVKSSELYAP DGEILGEMFE 
LRDVTEDKKE KRQREEIVAM MTHDLKSPLT VLMGYVQTLK GEMPQKIDIS LQPCLKEMDR 
SALKLLAMIE DVLDAYRLEV GLLQINCAVC DIGALLDGCC CDGLREAQAR GSNLTCNISE 
GIPPLKVDGK QLSRVFANLI GNALKFTPRR GSVTVTAEVR EDKVFVSVKD TGIGIPQKDV 
PRIFNKYFRS SAATGFKGTG LGLTISKAIV EAHSGTIEVE SVEGEGSCFS VIIPLGACH