Gene RoseRS_3943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3943
Symbol
ID	5210927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	4935030
End bp	4936319
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	59%
IMG OID	640597539
Product	Alpha-L-fucosidase
Protein accession	YP_001278245
Protein GI	148658040
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3669] Alpha-L-fucosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCACTC CAACGCCAAC GCGCGGCGAT ACGTCGTGGT TCGTCCGTGA TCGCTTCGGC 
ATGTTCATTC ACTGGGGATT GTATGCGCTT GCAGCACGCC ATGAGTGGGT CAAAAGCCGC 
GAGAAGATCG ACGACGAAAC GTATCAGCGC TACTTCGACC ATTTCGATCC CGATCTCTAC 
GATCCGCGCG TGTGGGCGCG CGCCGCGCGC GAGGCGGGGA TGAAGTATGT GGTGATCACG 
ACCAGGCACC ACGAGGGGTT CTGCCTGTGG GATACGCACT ATACGGCGTA TAAGGCGCCC 
AATACCCCGG CAAAACGCGA TCTGCTGAAA CCGTTCGTCG AGGCGTTCCG CGCCGAAGGA 
TTGCGCATCG GCTTTTACTA CTCCCTCATC GACTGGCATC ATCCCGATTT TCCGATCGAT 
ATCTACCATC CCCTCCGCGA CCACCCCAAT GTCGCCGAAT TGAATGCCGG TCGTGACATT 
CGACGATATG CCGCATATAT GCGCAATCAG GTGCGCGAAC TTCTTACCGG CTACGGACCG 
GTGGACATCA TCTGGTTCGA CTTCTCCTAC CCCAACCGCG CGTACAACGG TCTGCCGGGC 
AAAGGACGCG CCGATTGGGA GAGTGAGGCG CTGTTGCGGC TGGTGCGCGA ACTGGCGCCG 
GATATTATTG TCAATAATCG TCTCGATCTG CCAACCGAGT TCGCCGATGT GCATACCCCT 
GAACAGTTTC AACCGCGTGA ATGGGTGCAT GTCAACGGCG AACCGGTGGT GTGGGAGACG 
TGCCAGACAT TCAGCGGCTC GTGGGGCTAC CACCGCGACG AGATGACCTG GAAAAGCCCG 
GAACAACTCA TTCAGATGCT GATCAACTCG GTGGCTTGCG GCGGAAACCT GTTGATGAAT 
GTTGGTCCCA CCGCGCGCGG CACGTTCGAC GACCGGGCAA TGGCCGCGCT CAAGGTCTAT 
GCCGACTGGA TGCGCCTGCA TAACCGCTCG ATCTATGGCT GCACGCAGAG CGAGTTCGCC 
GCACCGACCG ACTGCCGCCT GACGCAAAAT GGGAAACGGC TCTACCTGCA CATCTTTTCC 
TGGCCCTTCC GCCATGTGCA TCTTGACAGC ATGGCAGGCA GGGTGGAATA TGCGCAACTC 
CTCCACGATG CCAGCGAGGT GAAACTGCTC GAGCCGGGCA GGCACAGTGA ATGGAGCATC 
GCTGAAACTG CCGCCGATAC GCTGACACTG GAATTGCCGG TGGCCAAACC CAGGGTAACG 
GTGCCGGTGG TAGAATTGTT CCTCCGTTGA

Protein sequence

MLTPTPTRGD TSWFVRDRFG MFIHWGLYAL AARHEWVKSR EKIDDETYQR YFDHFDPDLY 
DPRVWARAAR EAGMKYVVIT TRHHEGFCLW DTHYTAYKAP NTPAKRDLLK PFVEAFRAEG 
LRIGFYYSLI DWHHPDFPID IYHPLRDHPN VAELNAGRDI RRYAAYMRNQ VRELLTGYGP 
VDIIWFDFSY PNRAYNGLPG KGRADWESEA LLRLVRELAP DIIVNNRLDL PTEFADVHTP 
EQFQPREWVH VNGEPVVWET CQTFSGSWGY HRDEMTWKSP EQLIQMLINS VACGGNLLMN 
VGPTARGTFD DRAMAALKVY ADWMRLHNRS IYGCTQSEFA APTDCRLTQN GKRLYLHIFS 
WPFRHVHLDS MAGRVEYAQL LHDASEVKLL EPGRHSEWSI AETAADTLTL ELPVAKPRVT 
VPVVELFLR