Gene Rcas_3831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3831
Symbol
ID	5541334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5005503
End bp	5006897
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	63%
IMG OID	640895941
Product	TPR repeat-containing protein
Protein accession	YP_001433887
Protein GI	156743758
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.948329
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCCG ATACTTTGCA TCAGGCAATC GCGGCGGCGC GTGATGGTCG CCGTGACGAT 
GCGCGTGTTC TGTTGATGCG CACGCTGGAA GTGGACCCGC GCAACGAACG CGCCTGGCTC 
TGGCTGTCGG GAGTCGTTGA TGATCCCAAC GATGTGAAAA TCTGCCTGGA AAACGTGCTG 
GCGCTGAACC CGTCCAATGT GCGCGCTCGC CAGGGTCTGG AATGGCTTCA CGCCCGGATT 
GGTCTGCCGT TGCCGCCTTC CCCGTTGCTG GAACGCGGCG GTAACACCGA ACGTGAGATC 
GATGCCGGCG CCTTCGCGCT CACCCGCCTG CGCGCATATC GGGCGACTCT GGCGGACGTC 
GCGGTGATGC CGGCGCCTGC CCGCCAGAAT GTTCAGGCTG CGCCGGCGCC TGCTCGCCAG 
AGCGTTTCGT CCGTGCCGGC GCCAGGGCGC GCTGCCGTGC AGAGTGGCGC TCGCGCGCCC 
AATCGGGCAG CGGCAACATC CGCTGCGCGT CTTGCGTCAA TCGAAACGGA CGACAACACG 
ATCCCCTGCC CCTACTGCGG CGCGCCAACC GTCGAAGCAC AGCGCCGCTG CACGCAGTGC 
AACGAAAGCC TGCTGGTACG GGTGGCTCCG TCGGAAGAAC GATCACCAAT GGTGTCGGCG 
CTGGTCTGGC TGTGGCGCGG CGGCGCGATG GCGACAGTGC TGATCGCGCT CGTCTTTCCT 
GCCCTCGGTT TGCTCCTTTA TCAAGAAAAT CCGGCGCGCG GCTTTCTCAT CGGTATCCTG 
ATACCCGCCG CACTCCTCAT TCTAATGGCT CTGATCGGGT TGTCGGCGGC GCAACAACTG 
GCACAACGCT CCGTCTGGGG GCTGTACCTG GCAACCGGGT TGACCGTTGC CGGGTTGATC 
GGCGCCCTTG CGCTCGTCGG TCGCCCCGAT ATAATGCCGG TGATGCTCGA GCGACTGATC 
GGCGCGACGA CCCTTCCGCC GGAGTGGACA ACGCGGTTGC TATCCGGCGC CAGAATCGTC 
GCAATCAGCG CGATTGTTGC GCATATTGCC GCTCTCGCGC TGACTATCGC CGGGTATCAT 
CATATTGTCG GCAGACTCGA ACGTTTCCGC CATATCGTGA AGCCCTCTGA CCACGTGACG 
CACTATAACA ATGGTGTTGC GCTCAAGAAC CGTGGGATGT GGTATGCTGC GGCGCTCGAA 
TGGGAATGGG CAGTCAAAAA AGCGCCCTAC GACGTGACCT GTCTGCGTGC TCTGGGGCTG 
GCGTATGCGC GGTTGAAACA GTTCGACAAG GCGCGGACCA TGCTCGATCG GGCGATGCAG 
ACGGCGCCTC ACCAACCCGG TCTGGCGGAC GATCGCGCGC TGGTCGAACG TCTGGCATCT 
CAGAAAGAAC GGTGA

Protein sequence

MNADTLHQAI AAARDGRRDD ARVLLMRTLE VDPRNERAWL WLSGVVDDPN DVKICLENVL 
ALNPSNVRAR QGLEWLHARI GLPLPPSPLL ERGGNTEREI DAGAFALTRL RAYRATLADV 
AVMPAPARQN VQAAPAPARQ SVSSVPAPGR AAVQSGARAP NRAAATSAAR LASIETDDNT 
IPCPYCGAPT VEAQRRCTQC NESLLVRVAP SEERSPMVSA LVWLWRGGAM ATVLIALVFP 
ALGLLLYQEN PARGFLIGIL IPAALLILMA LIGLSAAQQL AQRSVWGLYL ATGLTVAGLI 
GALALVGRPD IMPVMLERLI GATTLPPEWT TRLLSGARIV AISAIVAHIA ALALTIAGYH 
HIVGRLERFR HIVKPSDHVT HYNNGVALKN RGMWYAAALE WEWAVKKAPY DVTCLRALGL 
AYARLKQFDK ARTMLDRAMQ TAPHQPGLAD DRALVERLAS QKER