Gene Rfer_1114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rfer_1114
Symbol
ID	3964352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodoferax ferrireducens T118
Kingdom	Bacteria
Replicon accession	NC_007908
Strand	-
Start bp	1196401
End bp	1197909
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	56%
IMG OID	637915935
Product	tryptophan halogenase
Protein accession	YP_522386
Protein GI	89899915
COG category	[R] General function prediction only
COG ID	[COG0579] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.650107
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCGA ATATGCTCAG GAGTATCGTC ATCGTCGGTG GTGGCACCGC AGGTTGGATG 
ACGGCCGCTG CGCTGTCCAA TGTATTGGGT GATCACTATC ACATTCGCCT GATCGAGTCC 
GACGAGATCG CCACCATCGG CGTGGGTGAG GCGACTATTC CGCTGATCAA AGACTTCAAT 
CTGGCGCTGG GCATTGACGA AAACGAATTC ATGCGCCAGA CGCAGGGGAC TTACAAACTC 
GGCATCGAGT TTGTCAACTG GGGCAAGATC GGCGACTCCT ATATTCACGG TTTCGGCAAG 
ATCGGTCAGG ACCTCGGCCC CATTGCGTGT TACCAATATT GGCTCAAGAT GCATCAGGCC 
GGTGAAGCAT CGGATCTGGG AAACTATTCA ATCAATACCC TGGCACCCAG AAAGTCGAAA 
TACCTTCGAA GCGAGCCCGA AATGGCCGGT TCACCCTTGG GCGACATTAA CAACGCCTTT 
CACTTCGACG CAGGTTTATA TGCCAAATTC TTGCGCGGCT ACTCGCAGGC GCGAGGCGTG 
GTGCGGACCG AAGGCCGGAT CGTGCAAACC ATGCTGCGGG AATCGGATGG CTTTATCGAA 
TCTGTCGTTC TGGCCAGCGG CGAAAAAATA TCCGGGGACT TTTTCATCGA TTGTTCCGGC 
ACGCGTGCAC TTCTGATCGG AGATGCACTT AAGTGCGAAT ACGAGGACTG GTCGCATTGG 
CTGCCCTGCG ATCGGGCGAT TGCCGTGCCC TGTGAATCCG TGCAGCCACT GGTTCCCTAC 
ACGCGCTCCA CGGCCCACTC TGCGGGTTGG CAATGGCGCA TTCCGCTGCA GCACCGCATC 
GGCAACGGCC ACGTCTATTC CAGCCGCTTC ATGAGCCAGG ACGAGGCCAC GTCGATTCTG 
CTGAACAAGC TGGACGGCAA GCAACTGGCA GAGCCGCGTT ATATCCCCTT CGTTCCGGGG 
CGTCGCAAGC AGACCTGGCG CAATAACTGT GTTGCGGTGG GCCTGTCCAG CGGCTTTTTC 
GAACCCATCG AGTCCACCAA TATTCATTTG ATCCAGTCCG CTATCGCACG GGTGATCAGG 
TTGTTTCCCA ATATGGGATT TCAACAAGCC GATATCGACG AATACAACGC GCAAACACAG 
TTCGAGTACG AGCGTATACG CGACTTCATC ATCTTGCACT ACAAGGCGAC GCAACGCGAC 
GATTCACCGT TCTGGAATCA CTGCCGGAAC ATGGAAATAC CGGCTACGCT GCAGCACAGG 
ATTAGCCTGT TCAGCAGCAA TGGCCGGGTC TACCGCGAGG GGCAGGAGCT GTTTGGCGAC 
GTGAGTTGGG TGCAGGTGAT GCACGGTCAA GGTATCCGGC CACAGGGCTA TAACCCTTTG 
GTGGATTTGC GCCCCAAGGA CGAAATCAGA GCTTACCTTG GCAATATCGA GGCCGTCATC 
AAGAAGTGTG TCGACGTCAT GCCAACGCAC GCAGAATTCA TCGCGAAAAA CTGTGCGGCC 
GCCGGGTAA

Protein sequence

MSANMLRSIV IVGGGTAGWM TAAALSNVLG DHYHIRLIES DEIATIGVGE ATIPLIKDFN 
LALGIDENEF MRQTQGTYKL GIEFVNWGKI GDSYIHGFGK IGQDLGPIAC YQYWLKMHQA 
GEASDLGNYS INTLAPRKSK YLRSEPEMAG SPLGDINNAF HFDAGLYAKF LRGYSQARGV 
VRTEGRIVQT MLRESDGFIE SVVLASGEKI SGDFFIDCSG TRALLIGDAL KCEYEDWSHW 
LPCDRAIAVP CESVQPLVPY TRSTAHSAGW QWRIPLQHRI GNGHVYSSRF MSQDEATSIL 
LNKLDGKQLA EPRYIPFVPG RRKQTWRNNC VAVGLSSGFF EPIESTNIHL IQSAIARVIR 
LFPNMGFQQA DIDEYNAQTQ FEYERIRDFI ILHYKATQRD DSPFWNHCRN MEIPATLQHR 
ISLFSSNGRV YREGQELFGD VSWVQVMHGQ GIRPQGYNPL VDLRPKDEIR AYLGNIEAVI 
KKCVDVMPTH AEFIAKNCAA AG