Gene Gura_4254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_4254
Symbol
ID	5165921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	4916581
End bp	4917804
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	50%
IMG OID	640551732
Product	putative PAS/PAC sensor protein
Protein accession	YP_001232970
Protein GI	148266264
COG category	[T] Signal transduction mechanisms
COG ID	[COG5000] Signal transduction histidine kinase involved in nitrogen fixation and metabolism regulation
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.157553
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCTGGT TTGCCACCAT GAAATTGAGC GCCAAGTTCA ACCTGATCAT GTCCAGCCTG 
TTAATCGTCT TGTTTCTTGC CGCCGCGTTC TTTACCTATA AGCGCGAGCA GTTGCTAATT 
ATGAAGGTGG CGGTCGATAA CGCGCGTCAC ATTGCCAAGC AGATAATTGA AACCCGGGAC 
TACATCTCCA GCGTGGTGCG GGGCGAGCCG GAAGGGAATT ATGCCCTTGT CCCGCAGGTG 
GTGGCTACAC AGGTAGCAAA AAGAATGACC ACCGGCAGTA AATATTACGT GCGCCAGGTT 
TCATTGCGCT ATCGCAATCC TGAAAACCGC CCCGATGATT ACGAAACGGA ACAGTTAAAG 
AAATTTGCCG GTAAAGCCAT CAGAGAGTCG TATTCGGTAG TCGAGGTTAA GGGCGAGCAG 
TCTTTTCGTT ATATGCAGTC AATGGTGGCG GAAAAATCAT GCCTTGAGTG CCACGGAACC 
TACGATCAGG CCCCCTTGTT CATACGCAAC CGTTTCCCGC GCGGCCATTA TTCTTACAAC 
TATAAACTAG GTGAGGTCAT CGGGGCCGTT TCGGTGACCA TTCCAATGGC CGAGCTGTAT 
CGTGAAATAG GTACAAACCT GAAGGTTGAC CTGATATACC GCGGAGGTAT ATTTTTTGTC 
ATTATTGTGA TAATGGGGGC CTTGATTAGG CGGAACATCA TCAATCCGAT CAAGATGCTG 
TCGGAGAGCA TCACCCAGGT AACGAGAACC GGCAGCTTTG CCGATCGACT GCCGAAGAAG 
TCGGATGACG AAATCGGCCA GCTCATTAAT TCATTTAACG AAATGATGGC GGAGCTGGAG 
CGCAAAATAG AGCAAAGCAG GGAATCCGAA GAACGTTACC GTAAATTCAT TGAGATTGCC 
AAGTCTGCGG TTGTCACCTT CATGCATGAC GGGAAAATTG TCATTGCGAA TCAGAAGGCC 
GAGGAACTAT TCGGTCTTCC CCGCCAGGAA CTGTTGGGGG AAATCGTCTA TAATTTCTTC 
GAGAACAGCG AAATGCTGAG GGAAGAAGTT TCCGATTATC TGCGAACCGG CGAGGAGAGG 
AAAGGCGCTG CTCGGACAAC CATGCAAAAG GTGCGTGATG TCAAAGGCGT TTCAAGGGAG 
GTAGAAGTGG CCCTTTCAGC GACCCAGACG GAGCATAGGC CGATGATAAC GGCGATCTTG 
AGGGAACTCA CCAGCAATAA ATGA

Protein sequence

MSWFATMKLS AKFNLIMSSL LIVLFLAAAF FTYKREQLLI MKVAVDNARH IAKQIIETRD 
YISSVVRGEP EGNYALVPQV VATQVAKRMT TGSKYYVRQV SLRYRNPENR PDDYETEQLK 
KFAGKAIRES YSVVEVKGEQ SFRYMQSMVA EKSCLECHGT YDQAPLFIRN RFPRGHYSYN 
YKLGEVIGAV SVTIPMAELY REIGTNLKVD LIYRGGIFFV IIVIMGALIR RNIINPIKML 
SESITQVTRT GSFADRLPKK SDDEIGQLIN SFNEMMAELE RKIEQSRESE ERYRKFIEIA 
KSAVVTFMHD GKIVIANQKA EELFGLPRQE LLGEIVYNFF ENSEMLREEV SDYLRTGEER 
KGAARTTMQK VRDVKGVSRE VEVALSATQT EHRPMITAIL RELTSNK