Gene Rcas_0066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0066
Symbol
ID	5537525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	81867
End bp	83078
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	61%
IMG OID	640892232
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001430222
Protein GI	156740093
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000558926
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00313159
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGACGAC GAGTGTTTCT TCGCAGCGTC GCGGCGGGCA GCGCAGCCCT GACGGCTGCT 
ACGCTGGCAG CGTGCGGCCA GGCTCCGCAG ACGCCAGCCC AGCAGGCGAC GACTGCCCCG 
GCTCAACAGG CGACGACCGC CCCGGCTCAG CAGGCGACGA CCGCGCCGGT AGCGACTGCG 
CCACAGGCGC AGGCGCCAGC CCAGACGAGC GAAATGCCAT CCATTGAGTG GGACATGGCC 
ACCAGTTGGC CCGTTGCACT CGACACGATC TTTGGCGGTG CGCAAACGGT CGCTGATCGT 
GTCGCAGCGA TGACCGACGG GAAGTTCAAA ATTACGCCGC GCGCCGCCGG TGAACTGGCG 
CCCGGTCTCC AGGTGCTCGA TGTGGTGCAG CAAGATGCCG TTCCGATTGG CCATACCGCG 
TCGTATTACT ATGTCGGCAA AAGCCCGGTC ACGGCATTCG GCACATCGCT GCCTTTTGGT 
CTCAATGCAC AGCAGCAGAA TGCCTGGTTG TACGATGGCG GCGGTTTAGA GAAGTTGCAA 
GCGGTGTACG CCAAACTGTT TGGCGTCATT CAGTTTCCGG CCGGCAACAC CGGCGTTCAA 
ATGGGTGGCT GGTTCCGCAA GGAAATTAAC ACTGTCGCTG ATCTCCAGGG TCTCAAGATG 
CGTATCCCCG GCCTCGGCGG GCAGGTGATG ACGAAACTCG GCGTCACGGT GCAGGTCATT 
GCAGGCGGTG AGATCTTCCA GGCGCTCCAG ACGGGCGCTG TCGATGCGGC AGAATGGGTC 
GGTCCGTATG ACGACGAGAA ACTCGGTCTG AACAAGGCAG CACAGTTCTA CTACTATCCG 
GGTTGGTGGG AGCCGGGTCC TACGCTCGAA GTGCAGGTCA ATCTCAATCG CTGGAATGAG 
TTGCCCAAGA CGTATCAGGA GGCGATCAAG ACCGCATCAG CCGAGGCGAA TATCACGATG 
CTTGCGCGCT ACGACGCACG CAACCGCCAA GCCCTCAAGC GTCTGGTGGA CGGCGGTGTG 
CAATTGCGTC CGTATAGCAA AGAAATCCTC GACGCTGCCG AGAAGGCCGC TTTTGAGCTG 
TACGACGAGT TCGCCGCCAA GGATGCCGAT TTCAAGGCGA TCTACGAGGA ATGGAAAGCA 
TTCCGCACGG CGATCTACGA GTGGAATAGG GTGAACGAGG CAGGGTTCAC CAACTACGTC 
TACAGCAAGT AG

Protein sequence

MRRRVFLRSV AAGSAALTAA TLAACGQAPQ TPAQQATTAP AQQATTAPAQ QATTAPVATA 
PQAQAPAQTS EMPSIEWDMA TSWPVALDTI FGGAQTVADR VAAMTDGKFK ITPRAAGELA 
PGLQVLDVVQ QDAVPIGHTA SYYYVGKSPV TAFGTSLPFG LNAQQQNAWL YDGGGLEKLQ 
AVYAKLFGVI QFPAGNTGVQ MGGWFRKEIN TVADLQGLKM RIPGLGGQVM TKLGVTVQVI 
AGGEIFQALQ TGAVDAAEWV GPYDDEKLGL NKAAQFYYYP GWWEPGPTLE VQVNLNRWNE 
LPKTYQEAIK TASAEANITM LARYDARNRQ ALKRLVDGGV QLRPYSKEIL DAAEKAAFEL 
YDEFAAKDAD FKAIYEEWKA FRTAIYEWNR VNEAGFTNYV YSK