Gene Rfer_1097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rfer_1097
Symbol
ID	3963481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodoferax ferrireducens T118
Kingdom	Bacteria
Replicon accession	NC_007908
Strand	-
Start bp	1174624
End bp	1175874
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	56%
IMG OID	637915918
Product	extracellular solute-binding protein
Protein accession	YP_522369
Protein GI	89899898
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000486653
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGAAAC TTTCCAAATT GTCTGCAGCC ATTGCATTTG TAGTGGTTGG CGCATCGGCC 
CTGGCCGGTG AAGTTGAAGT GCTGCATTGG TGGACATCGG GCGGCGAAGC CAAGTCGGTC 
AGCGAATTGA AAAAAATCAT GCAGAGCAAG GGCCACACCT GGAAAGACTT TGCGGTGGCC 
GGCGGCGGCG GTGACAACGC CATGACCGTG CTCAAAAGCC GTGTGGTGGC CGGCAACCCG 
CCCGCTGCAG CCCAGATCAA AGGCCCTGCG CTTCAAGAAT GGGCCTCTGA AGGGGTGCTG 
GCGAATCTGG ATGCCACTGC AAAAGCTGAA AACTGGGACA GCCTGCTGCC CAAGGCGATA 
GCAGACGGCA TGAAATACAA AGGGAACTAC ATCGCTGTTC CGGTCAATGT GCACCGCGTC 
AACTGGCTGT GGGCCAATGC GGCCGTGTTG AAAAAATCTG GCGTGGCGGG CATGCCCAAA 
ACCTGGACTG AATTTTTTGC CGCTACCGAC AAGATCAAGA AGGCGGGATT TATCCCGGTT 
GCAACGGGTG GCAATGCCTG GAATGACCTC ACCAACTTTG AGCCTGTGGC GCTCGGTGTC 
GGCGGTGTCA AGTTTTACAA CGATGCGTTT GTCAAACTTG ACCCTAAAGC ACTGAACAGC 
GATGCCATGA AGAAATCGCT GGAGACCTTT CGCAAGCTCA AAGGCTACAC CGATGCCGGT 
GCCGTGGGTC GCGACTGGAA TATCGCCACG GCGATGGTGA TCCAGGAGAA AGCCGGCTTC 
CAACTCATGG GCGATTGGGC CAAGGGCGAA TTTGTCGCTG CCGGCAAGGT GCCGGGCAAA 
GATTTCCTGT GTGCCGCAGC ACCTGGCAAT GCAGGCACCT ACACCTTTAA CGTGGATTCA 
TTCGCCATGT TCAAGCTCAA GGATGCGGCA GCCCAAAAGG CGCAGGCAGA CCTTGCCGTT 
GCCATCATGG GCCCTGAATT CCAGGAAGTA TTCAACCTGA ACAAAGGCTC CATCCCGGTT 
CGCTTGAACA TGAACATGGA CAAGTTTGAC GAATGCGCCA AGCTGTCGGC CAAGGAATTT 
GTTGACACCG CCAAGTCGGG TGGCCTGGTT CCTTCCGTTT CCCAGGATAT GGCGCTCAAG 
CCCGCCGCGA CGGGTGCCCT GAAAGATGTC GTCAGCCAGT TCTGGAACGA TGACAAGATG 
ACGCCGGAAA CGGCCATGAA GAATATGGTC AAGGCGGCTA CGACCAAATA G

Protein sequence

MLKLSKLSAA IAFVVVGASA LAGEVEVLHW WTSGGEAKSV SELKKIMQSK GHTWKDFAVA 
GGGGDNAMTV LKSRVVAGNP PAAAQIKGPA LQEWASEGVL ANLDATAKAE NWDSLLPKAI 
ADGMKYKGNY IAVPVNVHRV NWLWANAAVL KKSGVAGMPK TWTEFFAATD KIKKAGFIPV 
ATGGNAWNDL TNFEPVALGV GGVKFYNDAF VKLDPKALNS DAMKKSLETF RKLKGYTDAG 
AVGRDWNIAT AMVIQEKAGF QLMGDWAKGE FVAAGKVPGK DFLCAAAPGN AGTYTFNVDS 
FAMFKLKDAA AQKAQADLAV AIMGPEFQEV FNLNKGSIPV RLNMNMDKFD ECAKLSAKEF 
VDTAKSGGLV PSVSQDMALK PAATGALKDV VSQFWNDDKM TPETAMKNMV KAATTK