Gene Rcas_4307 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4307
Symbol
ID	5541818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5556845
End bp	5558251
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	62%
IMG OID	640896413
Product	type I phosphodiesterase/nucleotide pyrophosphatase
Protein accession	YP_001434351
Protein GI	156744222
COG category	[S] Function unknown
COG ID	[COG3379] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTATC CTCGTCTTCT CATTATCGGC CTCGATTGCG CCGAACCATC GCTGGCGTTC 
GATCAATGGC GCGCCGATCT GCCCACCCTC AATCGCTTGA TGGCAGAGGG AGTCTACGGC 
GAGTTGGAGA GTTGCATTCC GGCAATCACC GTGCCTGCCT GGAGTTGCAT GATGAGCGGG 
CGCGATCCGG GGGAACTTGG CGTTTACGGC TTTCGCAACC GCGCCGATCG TTCCTATGGT 
CGTATGGTCG TCGCCGATAG TCGTGCCATT CGTTTTCCAC GTTTGTGGGA CATCCTTGGC 
AATGCGGGAT GGCGCGTCGC GGTGATTGGC GTGCCGGGGA CGTACCCGCC ACCGCCGGTC 
AATGGCGCGC TCATCTCGTG TTTCCTCGCA CCCTCCACGG ACGCAGCGTA TACCTTTCCG 
CCGACACTCG CCGGGCGCGT TGCCGCCTGG ACCGCAGCCG CGACGCCGGG GCGTCCGTAT 
CTGCTCGATG TGCCGGATTT CCGTTCCGAC GACAAACAGC GTATCGCGCG CGACATCTAT 
GCCATGTGCG ATCAGCGCTT CGCAGTGGCA ACGGCGCTGC TGGAAGAAGA GCATCCCGAC 
TTTCTGATGC TGGTGGATAT GGGCGTGGAT CGCATCCACC ACGCGCTCTG GAAGCATATG 
GACCCGCGTC ATCCGTTGTT TGTTCCCGAC TCGCCTTTCG CCGACGCCAT TCGCGCGTAC 
TATCGTCACG TGGATACGCA GATCGCCGGT CTGCTGACGC GCTGCGGACC CGACACGGCA 
GTCCTGATCG TGTCGGACCA CGGCGCGCGC CCGTTGATGG GAGGCGTGCG GATCAACCAG 
TGGCTGATCG AACAGGGTGA TCTGAGCGTC CGGGCAATGC CGGACACCCC GACGAGTCTC 
GATCAGGTCG AGGTTGACTG GTCACGCACG CGCGTCTGGG GCGCCGGCGG CTACTACGGG 
CGAATTTTTC TCAATGTGCG CGGGCGTGAG CCGCAGGGAG CCATCTCAGC AGCAGAGTAC 
GAACGTGTGC GCACCGATCT TGCAGCGCGC CTGGAAGCCA TGCCAGGACC CGACGGATGT 
CCGCTGGGCA ATCGTGTTTT CACACCCCGG CAACTCTACC GCGCAGTGCG TGGCATCGCG 
CCCGATCTGA TCGTCTACTT CGGCGATCTT GGATGGCGCG CGGTCGGAAC GATCGGCGGC 
ACGGGCATCT TCACCCAGGA AAACGACACC GGTCCTGATG ACGCCAATCA TGCGCAGCAC 
GGAATGTTCA TCTGGCGCGA CCCGCAACGT CCGGGCGGCG GACGGCGATT CGACAGGGTG 
CAGATTTACG ATATACTGCC GACTCTGTTG AGACGGTTCA ACATGCCGAT TCCTGAAGGA 
CTACGCGGCA CGGCGCTGAA TCTATAA

Protein sequence

MTYPRLLIIG LDCAEPSLAF DQWRADLPTL NRLMAEGVYG ELESCIPAIT VPAWSCMMSG 
RDPGELGVYG FRNRADRSYG RMVVADSRAI RFPRLWDILG NAGWRVAVIG VPGTYPPPPV 
NGALISCFLA PSTDAAYTFP PTLAGRVAAW TAAATPGRPY LLDVPDFRSD DKQRIARDIY 
AMCDQRFAVA TALLEEEHPD FLMLVDMGVD RIHHALWKHM DPRHPLFVPD SPFADAIRAY 
YRHVDTQIAG LLTRCGPDTA VLIVSDHGAR PLMGGVRINQ WLIEQGDLSV RAMPDTPTSL 
DQVEVDWSRT RVWGAGGYYG RIFLNVRGRE PQGAISAAEY ERVRTDLAAR LEAMPGPDGC 
PLGNRVFTPR QLYRAVRGIA PDLIVYFGDL GWRAVGTIGG TGIFTQENDT GPDDANHAQH 
GMFIWRDPQR PGGGRRFDRV QIYDILPTLL RRFNMPIPEG LRGTALNL