Gene Rcas_0598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0598
Symbol
ID	5538061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	796230
End bp	797735
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	59%
IMG OID	640892759
Product	Alpha-N-arabinofuranosidase
Protein accession	YP_001430745
Protein GI	156740616
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3534] Alpha-L-arabinofuranosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.832453
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTACCA GACCACCTGC ACGCATCTCC ATCGATGAAG AGCGCGTCAT TGGTCGCATT 
TCGCCGCTCC TGTTCGGCGG ATTCATCGAA CATATGGGGC GCTGCGTCTA TCAGGGCGTG 
TTCGATCCCG GATCGCCGCT GGCTGATGAC CAGGGGTTCC GCACTGATGT GCTGGCAGCG 
CTGCGCGAAC TGAACCTGCG GATCATTCGC TACCCTGGCG GCAATTTTCT GTCTGGCTAT 
CACTGGCGTG ATGGTGTGGG ACCGGTCGCA CAGCGTCCGC GTCGCCGCGA ACTGGCGTGG 
CAGTCGATTG AAACGAACCG CTTCGGCACA CACGAGTTCA TTGCGTTGTG TCGTATGCTT 
GGCGCTGAAC CAATGCTCGG CGTCAACCTG GGGACCGGTA CGATCGAAGA GGCTGGCGCA 
TATGTCGAGT ACTGCAACGC TCCAACCGGC ACAATCGAAG CCGATCGGCG AGTTGCGAAC 
GGCGCACCGG AGCCGTTTGG CGTGCGCTAC TGGTGTCTTG GCAATGAGAT GGACGGACCC 
TGGCAGATCG GTCATATGGA CGCGCACGCT TACGCTGTCA AAGCCCGCGA AGCCGCAAAA 
CTGATGAAGT GGCACGATCC GTCGATCCGC CTGACGCTCT GCGGTTCATC GAGCAGCGGT 
ATGCCGACCT ATCCCGAATG GGACCGAATT GCGCTCGAAG TGTGCTGGGA GTATGTCGAT 
TATCTGTCGC TCCACTTCTA CGCGGGCAAC CGCGATGACG ATACTGACAG TTATCTGGCG 
CTGGCGCGCC AGTTCGAGGA GCATCTCGAC GCTCTCGCCG GGACATTGCG CTATGTGAAG 
GCAAAGATGC GATCACGTCA TAGTGTCTAT CTGAGCTGGG ATGAGTGGAA TGTGTGGTAC 
AAAGACCAGA CAACGCAAGG GGGATGGCGC GAAGCGCCAC ACCTGATCGA GGAGGTGTAC 
AACCTGGAAG ACGCACTGGT CGTAGCGCAG TGGCTGAATG TGTTCCTGCG CCGCTGCGAT 
GTGCTGAAGA TCGCCTGCCT GGCGCAACTG GTCAATGTTA TCGCGCCCAT TCTGACCCGT 
TCTGATGGGT TGATCCGTCA GTCGATCTTC TATCCGTTCG CGCTTTTCAG CCGGTATGCA 
ACCGGCGACT CGCTCGACCT GCTCGTCCGG TCGCCGCTAT ATGCCACTCG CGCCTTCGGC 
GATCAGCCCC TGATCGACGC AGCAGCCAGC TACGATGCTG AACATGGCAA GGGCGCCATT 
TTTGTGGTTC ATCGCGGACA ACATGCGCCG CTAACGGTGA ATCTGGAGTG GCAGGGGCGT 
TCGCCACGCC AGATCACGGA GATCTATCAG GTTGCCGGTG ATGATCCAAA AGCCGTCAAT 
TCCTTCGAGC GACCCGATGT TATTGGCGTG CGCGCCCTGC CCGGCGCTCC GATCACCGAC 
AGGCGGTTCA GCCTGAATCT CCCTCCACTC TCATTGACGG TAGCGCTGGT CGAATGGCCG 
ACCTGA

Protein sequence

MTTRPPARIS IDEERVIGRI SPLLFGGFIE HMGRCVYQGV FDPGSPLADD QGFRTDVLAA 
LRELNLRIIR YPGGNFLSGY HWRDGVGPVA QRPRRRELAW QSIETNRFGT HEFIALCRML 
GAEPMLGVNL GTGTIEEAGA YVEYCNAPTG TIEADRRVAN GAPEPFGVRY WCLGNEMDGP 
WQIGHMDAHA YAVKAREAAK LMKWHDPSIR LTLCGSSSSG MPTYPEWDRI ALEVCWEYVD 
YLSLHFYAGN RDDDTDSYLA LARQFEEHLD ALAGTLRYVK AKMRSRHSVY LSWDEWNVWY 
KDQTTQGGWR EAPHLIEEVY NLEDALVVAQ WLNVFLRRCD VLKIACLAQL VNVIAPILTR 
SDGLIRQSIF YPFALFSRYA TGDSLDLLVR SPLYATRAFG DQPLIDAAAS YDAEHGKGAI 
FVVHRGQHAP LTVNLEWQGR SPRQITEIYQ VAGDDPKAVN SFERPDVIGV RALPGAPITD 
RRFSLNLPPL SLTVALVEWP T