Gene Rcas_1841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1841
Symbol
ID	5539319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2351159
End bp	2352307
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	60%
IMG OID	640893979
Product	phosphotransferase domain-containing protein
Protein accession	YP_001431950
Protein GI	156741821
COG category	[R] General function prediction only
COG ID	[COG0613] Predicted metal-dependent phosphoesterases (PHP family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACCACT ACCCTGGCGC CATTCATATG CACACGCGCT TCTCCGATGG CAGCGGCAGT 
GTCGAAGACC TGGCGTGCGC AGCGCGTGAT GCGGGACTGC GCTGGATCAT CATTACCGAC 
CACGATGATC TCCAGGCAAA GCGATACGAG GGGTGGCTGC ACGACGTGCT GGTGATCGCC 
GGTCACGAGA TCACGCCGCC GCGCAACCAT TTTCTGGCGC TTGGTATCGA CCGCGTCATC 
GACAAGCGTC TTCCGCCGCA GGAGTTTATC AATCAGGTCT ACGACGCTGG CGGCTTTGGC 
ATCATTGCCC ATCCCGACGA GCGGGTGAAG AATAGTTTTA AAGATGTCTA CCGCTGGGAC 
GATTGGGGAA TCGACGGTCC GCGTGATCGC AATGGACGCA CCGTTGGGAT CGAACTATGG 
AACCTGATGA GCGACTGGGG GGAACATCTG ACCCGGCGCA ACAAAGAGGT GATCTATTTC 
TTTCCGCGCC TGGGCATCAG CGGTCCGACG GCAGAGACGC TCGCCTGGTG GGACCGGCTC 
AACATGGCAG GGAAGCGCAC TTTTGGCATT GGCGGGGTCG ATGCCCATGC ATTTGTGCGC 
AAGACGCTCT GGGGACGGGT CGAGGTCTTT CCCTACCGCT GGATGTTTGG TACGTTGACG 
AATTATGTGG TTCTGCCAGA TCGACTGCCG CTCGATGTTG CCGAGGCAAC CCGAACCATC 
CTCAACGCGC TCGCTGCCGG TTGTTCGTAT TTTGTCAACC GACTCGACGG TGATTGCCCG 
GCGTTGACGT TTTACGCAGC ACGCGGAGCA GCATACTGGC ATCCGGGCGA TACTGCCGAT 
CTGCGCGATG GTCCGCTCAC GTTCATGGTT GATGTCGGGT GTGATGCGCA GGTGCATCTG 
ATCCACGATG GACGCATTCT TGCGCGTGGC GCGCGTCTAC TGCGCCATTC GGTCATGCTG 
CCGGGAGTCT ACCGCATGGA AGCGTATCGC CGTGGAATGC CGTGGTTGTA TACCAACCCG 
GTGTATGTTG TAGGCGTGGG GCGAGAGGTG AGAGGCGAGA GGGGGGGAAG GCGAGAGGTG 
AGAGGGGGGA AGGGGGGAAG GCGAGAGGGG GGGAAGGCGA GAGGCGAGAG GGGTCCGACA 
ATGGCGTAG

Protein sequence

MYHYPGAIHM HTRFSDGSGS VEDLACAARD AGLRWIIITD HDDLQAKRYE GWLHDVLVIA 
GHEITPPRNH FLALGIDRVI DKRLPPQEFI NQVYDAGGFG IIAHPDERVK NSFKDVYRWD 
DWGIDGPRDR NGRTVGIELW NLMSDWGEHL TRRNKEVIYF FPRLGISGPT AETLAWWDRL 
NMAGKRTFGI GGVDAHAFVR KTLWGRVEVF PYRWMFGTLT NYVVLPDRLP LDVAEATRTI 
LNALAAGCSY FVNRLDGDCP ALTFYAARGA AYWHPGDTAD LRDGPLTFMV DVGCDAQVHL 
IHDGRILARG ARLLRHSVML PGVYRMEAYR RGMPWLYTNP VYVVGVGREV RGERGGRREV 
RGGKGGRREG GKARGERGPT MA