Gene Rcas_3538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3538
Symbol
ID	5541037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4612842
End bp	4614062
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	59%
IMG OID	640895655
Product	hypothetical protein
Protein accession	YP_001433605
Protein GI	156743476
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.25155
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTATCTG GACGACTTGG AACCGTAGCA CTGTGGCTGC TGATCGTCTG CGCAGCGGTT 
TTTCTGTTTG AACGCGCCGT GGTTGTGGTC AGTTTTTTCG CCACACCGCT CCTTCTCTTC 
GCCCTTGCCT GGCTGATCGC CGTTGTGCTA CAACCGCTGG TGTCGCACTT GACGGCGCTC 
GATCTGCCGA CGATTACCAT TCGCGCGCAC AGCGTCCCGG TTCCGCCGCG CCATCTGTCG 
CGCGTGCTCT CAGTGGCGCT GATCTACCTG GCGCTCTTCG CTATTCTCCT GGTCGTCATT 
CTGTCGTTCG TGCCGACAAT TACGCAACAA CTGACGACGT TGACCGGATC GGCGCCGACC 
ACGGTCGAAT CGGTTGTCCG GTGGATCGGT CGGCTGGAAG AAGGGCTGCA ACGGTTCGGC 
TTTCGCGGCG ACCTGACAGC CATCGTTCAA CCCGAAGCCA TTACCCGGCA ACTTACCGGT 
ATCGGCAGTG CGATGTTGCA GCAATCGCTT GGCATTGCCG GCAGCATCGC CACGGTGCTG 
TTCAATATTT TCCTGGTGCT GATCCTCAGT TTCTATATTA CGCTCGACGG TCCGCGCATT 
GGCAAGAGTT TCATTATGCT CCTTCCCCGA TCCTGGCACG ATGAGATGGA CGGTCTGTTT 
GCCGTTGTTG ATCGCGTGTT TGGCGGCTTT ATGCGCGCGC AGTTTGTCAA CTCGCTGCTC 
TATGGCATCG CCAACGCGAT TGTAATGGCG CTGTTCGGAT TGAGCGACAT TGCCCTTGCC 
AGCGTGATTG CCGCGATCCT GGTATTCATT CCGCTCGTAG GCGGATTTTT TGCGCTGATT 
CCTCCGGCGT TGTTCGCCAT TCTGTTTGTG CCGGATCGGG TAGGGTGGCT GGTCCTGGTG 
TTGCTGGCGG TGCAGCAGGT GCAGTTCAAT GTGATCATGC CGCGCCTCGT CGGGCAGGCC 
ATCGGACTGC ATCCGCTACT CGTCTTTGCC GCACTGCTCC TCGGCGGAAC CGTTGCCGGC 
GGATGGGGAG TCCTCTTTGG CATCCCGGTC GCTGGTGTCA TTGCGTCGAT TGCCCAGTTC 
TTCTATGAGC GCGCCCGCCG CACCATGATC ATCGTTCCTT CCACAGTCGA TGAATCGTTG 
CCGTCAGCCT CTGCCACGGT TGCGGCGTCT TCCGTCGATC CTGCGCCGGG CAGCCCGCAA 
TCGTCGCGCT TGACGCAGTA G

Protein sequence

MLSGRLGTVA LWLLIVCAAV FLFERAVVVV SFFATPLLLF ALAWLIAVVL QPLVSHLTAL 
DLPTITIRAH SVPVPPRHLS RVLSVALIYL ALFAILLVVI LSFVPTITQQ LTTLTGSAPT 
TVESVVRWIG RLEEGLQRFG FRGDLTAIVQ PEAITRQLTG IGSAMLQQSL GIAGSIATVL 
FNIFLVLILS FYITLDGPRI GKSFIMLLPR SWHDEMDGLF AVVDRVFGGF MRAQFVNSLL 
YGIANAIVMA LFGLSDIALA SVIAAILVFI PLVGGFFALI PPALFAILFV PDRVGWLVLV 
LLAVQQVQFN VIMPRLVGQA IGLHPLLVFA ALLLGGTVAG GWGVLFGIPV AGVIASIAQF 
FYERARRTMI IVPSTVDESL PSASATVAAS SVDPAPGSPQ SSRLTQ