Gene Rfer_1099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rfer_1099
Symbol
ID	3963483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodoferax ferrireducens T118
Kingdom	Bacteria
Replicon accession	NC_007908
Strand	+
Start bp	1177505
End bp	1178767
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	61%
IMG OID	637915920
Product	extracellular solute-binding protein
Protein accession	YP_522371
Protein GI	89899900
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000491601
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTTTA ATGCTGCCCG TACCGCAGGC AAAATTCTTT CCCTGACGGT GCTGCTCGTC 
AGCACCAGCC TGGCCCAAGC CCAGAGCCAG ATACTGTCCG TGACGGCTTA CCCGGCGGTG 
GACGAGATCA TCAAGGCCGC GATGCCACAG TGGAAGAAGA CGCATCCCAA CGTCGAGATC 
AAACTGGTCA GCCGTGCATT TGAGGATCAT CACACCGCCA TGACCACGGC CCTGTCCACC 
TCAAGCAATC TGCCGGACGT GATGGCGCTG GAATTTGCCT ACGTGGGCCG CTTTGGCGCG 
GGAGGTGGAC TGGAAGATCT GTCTCAGTCG CCTTACCGAA TCAAGGACAC GCAAATGCGT 
TTTGTGCCCT TTGCTTTCAG GCAGGCCACC CTCAGTACTG GCGCGGTGGT GGCCGCGCCC 
ACTGACATCG GCCCGGGCAC CTTGCTGTAC CGGACCGATC TGCTTAAAAA AGCCGGTGTC 
AGCGAAGCGG AGCTGACGCA GTCCTGGGAC TCCTTTGTGG CGTCGGGCGT GAAGATCAAG 
GCCACCACGG GCGCCTACCT AATGGCGCAC GCGCGCGATA TCAAGGACAT CCTGATCCGC 
TCCAACGTCA AGCCGGGCGA TGGCCTGTAC TTTGATGCCG CCGGCAAGGT GGTGGTGGAT 
TCGTCGCGCT TTGTGCGCGC GTTCGAACTG GCGCGCAGGG TGCGCCAGCA ACAGCTCGAC 
GGCAAGATCA GCGGCTGGTC GACCGCATGG TCTCAGGGCT TCAAGAACGG CAACATCGCC 
ACGCAGATGT CGGGTGCCTG GCTGGCCGGG CAAATGGCAA GCTGGATTGC ACCCACCACA 
AAGGGTCTCT GGCGTGCCTC GCAGCTGCCC GAAAAAGCCT GGGGCGCTTG GGGCGGCACT 
TTTTATGCGA TCCCGAAGGC GGCGAAGAAC AAGGCGCTGG CCTGGGAGTT CATCCAGTTC 
ATGACGCTCA ACCGCGACGC ACAACTCAGC GCGTTCAAGG TGCAGGACGC TTTTCCGGCC 
TTGCTCGAAG CGCACACTGA TCCGTTTTAC GACCAGCCGA TTGAATTCCT GGGCGGGCAG 
AAAGCGCGTC TGCTGTGGCG CGAAGCGGCA CTGAAAATCA ACGCCATCGA CGTGAACAAG 
CTGGACCCGA TTGCCGACGA AATCGTCAAC ACCGAGCTCG ACAAGGTGCT GGACCAGGGC 
AAGGACATTC CCAAGGCGCT GGCTGATGCC AAGGCCTTGC TGGAGCGGCG TGCGCGCCGC 
TAA

Protein sequence

MLFNAARTAG KILSLTVLLV STSLAQAQSQ ILSVTAYPAV DEIIKAAMPQ WKKTHPNVEI 
KLVSRAFEDH HTAMTTALST SSNLPDVMAL EFAYVGRFGA GGGLEDLSQS PYRIKDTQMR 
FVPFAFRQAT LSTGAVVAAP TDIGPGTLLY RTDLLKKAGV SEAELTQSWD SFVASGVKIK 
ATTGAYLMAH ARDIKDILIR SNVKPGDGLY FDAAGKVVVD SSRFVRAFEL ARRVRQQQLD 
GKISGWSTAW SQGFKNGNIA TQMSGAWLAG QMASWIAPTT KGLWRASQLP EKAWGAWGGT 
FYAIPKAAKN KALAWEFIQF MTLNRDAQLS AFKVQDAFPA LLEAHTDPFY DQPIEFLGGQ 
KARLLWREAA LKINAIDVNK LDPIADEIVN TELDKVLDQG KDIPKALADA KALLERRARR