Gene Rcas_2458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2458
Symbol
ID	5539939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3158506
End bp	3159672
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	63%
IMG OID	640894588
Product	hypothetical protein
Protein accession	YP_001432556
Protein GI	156742427
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.21472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATCCA CGGTGATGCT TCCTCAACCT GACCGCTCGT TACGCGCCTA CACCTTTCGT 
CCTCCCGCTG CGTTTGCGCC GCCAACTGCA CCGCTGCGCA GCCGTGTCTT CTTTGCTGCC 
GCGCATATCG TCGCCGACCC GCTCGCCGAT GTGACTCCCG CATCGCCTCC GGCGCTCGAT 
TGGGAGGCGA CGCTGGCGTA CCGCCGTTAT CTCTGGTCGC TGGGTCTGGG TGTCGCTGAA 
GCCATGGACA CGGCGCAGCG CGGTATGGGG CTCGACTGGC TCACGGCGCG TGATCTGATC 
ATGCGTTCTG TGGCGGAGGC GCGCGCCGTC GGCGGTGTGA TCGCCTGCGG CGCAGGGACC 
GATCACCTGC CGCCCTCCCC CAACCTCACG CTCGATCAGG TTGAATCGGC GTATGCTGAA 
CAGGTTGAAG CGGTCGAACA TGCAGGCGGG CGCGTGATCC TGATGGCAAG CCGCGCGCTT 
GCCGCATGCG CGCGCGGTCC CGACGATTAT GCCCGTGTCT ATGGGCGGAT TCTGTCGCAG 
GTGCGTGAGC CGGTCATCAT TCACTGGCTC GGCGATATGT TCGATCCGCA CCTCGCCGGG 
TATTGGGGCA GCCGCAACCT CGATGACGCG ATGATGACGG CGCTTGCCAT CATTCACGAC 
CATGCGGCGA AGATCGACGG CATTAAGATC TCCCTGCTCG ATGCACACCG TGAGGTTCAA 
ATGCGCCGAC GGTTGCCGCC GGGGGTTCGT ATGTACTCCG GCGATGATTT CAACTACCCC 
GATCTGATCC TGGGCGACAA TCAGGGATAT AGCGATGCGT TGCTGGGTAT CTTCGACGCA 
ATTGCTCCGG CGGCATCGGC AGCGTTGCAG GCGCTCGATG CCGATGATCC GTCGCGCTTT 
CAGGCGATCC TCGAACCGAC CGTGCCGCTC TCGCGGCACA TCTTTCAGGC GCCGACCTAC 
TACTACAAAA CCGGCGTTGT CTTCCTCGCC TATCTCAACG GACATCAGAA CCATTTCCGC 
ATGGTCGGCG GTCAGGAAAG CGCGCGCTCC ATCGTCCATC TGGCGCAGTT GCTGGTCCTG 
GCGGATCAAG CGGGCGTGCT GCGCGACCCG GACCTCGCTG CTGCGCGAAT GCGCCACGTG 
CTGGCGCTGG CAGGAATTGA GGGGTGA

Protein sequence

MPSTVMLPQP DRSLRAYTFR PPAAFAPPTA PLRSRVFFAA AHIVADPLAD VTPASPPALD 
WEATLAYRRY LWSLGLGVAE AMDTAQRGMG LDWLTARDLI MRSVAEARAV GGVIACGAGT 
DHLPPSPNLT LDQVESAYAE QVEAVEHAGG RVILMASRAL AACARGPDDY ARVYGRILSQ 
VREPVIIHWL GDMFDPHLAG YWGSRNLDDA MMTALAIIHD HAAKIDGIKI SLLDAHREVQ 
MRRRLPPGVR MYSGDDFNYP DLILGDNQGY SDALLGIFDA IAPAASAALQ ALDADDPSRF 
QAILEPTVPL SRHIFQAPTY YYKTGVVFLA YLNGHQNHFR MVGGQESARS IVHLAQLLVL 
ADQAGVLRDP DLAAARMRHV LALAGIEG