Gene Rcas_0007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0007
Symbol
ID	5537464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4718
End bp	6460
Gene Length	1743 bp
Protein Length	580 aa
Translation table	11
GC content	64%
IMG OID	640892172
Product	phosphotransferase domain-containing protein
Protein accession	YP_001430164
Protein GI	156740035
COG category	[L] Replication, recombination and repair
COG ID	[COG1796] DNA polymerase IV (family X)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0296814
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.000000000565114
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGACAGCAT ACCCGACTAA TCACGATATT GCGGAAGTTT TCAGCGCCAT TGCCGATCTG 
ATGGAGATTC TGGACGAGGA TCGGTTTCGC GTGCAGGCGT ATCGGCGCGC CGGCGATGTG 
ATTCGTCATC TGCCGGCGCC GCTGGCGACC TACCGCGCTC GCGGTGAATT AGAGCAGATC 
CCTGGCGTTG GCAAAGCCAT CGCCGAAAAG ATCGGCGAAC TCCTCGATAC CGGGGAGTTG 
CCGTACTACA ACCGGCTCCG GGAGAAGGTT CCTCCCGGCG TGCGTGAATT GCTGCGCGTT 
CCTGGCATCG GTCCGCGCAC TGCCGGTCGC CTCTACCGCG AACTCGGGAT CACCAGCCTG 
GCAGAGTTGA AGGTTGCTGC CGAAGCCGGG CGCCTGGCGG CCCTTAAGGG GTTTGGTGCG 
AAAACCATTG ACAGCATTCT GCAAGGCATC AGCGCGGCGG AGCGGCAGGA GCGTCGGATG 
CTGCTGGCGC ACGCGATCGA TAGTGCCGAA GCGTTGATCA ACGCTCTGCG CGCCGCTGTG 
CCGGCGCTGA GTCAGGCGGC GTATGCCGGC AGCCTGCGCC GTGGCCGCCC CACTGTTGGC 
GATCTCGACA TTCTGGCGGC TGCCGATGAT GCGCCCGCTG TTGTGCGCGC CTTTACGATG 
CTGCCGCTCG TGGCACGGGT CGAGTCGGCA GGGGACGAAA AAGCCAGCAT TCTGCTCCAT 
AATGGCATGC AGGCGGACCT GATCGCGGTT CCGCCGGGCA TGTGGGGGTC GGCGTTGCAG 
CACTTTACCG GCAGTAAAGC GCACAATATC CACTTTCGTG AGCTGGCGCT GGCGCAGGGA 
TTGAGTTTCA GCGAGCATGG CTTCCGTCGT GCCGATGGCA CGCTGCTGAC ATGCGCCACC 
GAGGAAGAGG TGTACGCTGC CATCGGTCTG CCCTGGATTC CACCGGAATT GCGCGAGGAC 
GAGGGGGAGT TCGAGGCGGC GCGCGCCGGC ACGTTGCCGT GCCTGGTCGA ACTCAGCGAC 
ATCCGCGCCG ATCTCCATCT GCACAGCACC TGGAGCGACG GACGCGCCGA TATTCGCACC 
ATGGCAGAAG CCGCGCGCAC CCGTGGCTAT TCCCATATCG CTATCACCGA CCATAGCGCG 
TATATGGGGA TGACTCACGG ATTGGATGCA GAGCGCCTGC GCGCACAGCG CCAGGAGATC 
GCAGCATTGA ATGCCGAATA TGCGGCGCGC GGTATTCCGT TTCGCATCCT GCACGGCGTC 
GAGGTCGATA TCACTCCTGA AGGAAATCTG GCATTGCCCG ACGATGTGCT GGCGGAACTC 
GATATTGTTG TCGCTTCGGC ACATATTCAG TTGCGTCAGT CGCCCGAAGC AGCGACCGAG 
CGGTTGATCC GCGCCGTGCG CAATCCGCAC GTCGATATCA TCGGGCATCC GGTGGGGCGG 
ATGCTGGGAT CACGCGACGG CGCGCCGGTC GATATCGATG CGCTGGCGTA TGCCGCTGCC 
GAGCATCGCG TGCTGCTGGA GGTCAACAGC GGACCGCACC GCCTCGACCT GGATGGCGCC 
GCAGTGCGGC GCGCGCTGGC GTCTGGCGCT GTCATTACCA TCAACAGCGA TGCGCACCAT 
CCCGACAATC TGGCGTGGAT GCGGTTCGGC GTCGTCACGG CTCGGCGCGG TTGGGCTGGT 
GCGGCGCAGG TGGCGAACAC CTGGAGTGAT GAAGCGCTTC AGGAGTGGTT GAGTCGACGT 
TGA

Protein sequence

MTAYPTNHDI AEVFSAIADL MEILDEDRFR VQAYRRAGDV IRHLPAPLAT YRARGELEQI 
PGVGKAIAEK IGELLDTGEL PYYNRLREKV PPGVRELLRV PGIGPRTAGR LYRELGITSL 
AELKVAAEAG RLAALKGFGA KTIDSILQGI SAAERQERRM LLAHAIDSAE ALINALRAAV 
PALSQAAYAG SLRRGRPTVG DLDILAAADD APAVVRAFTM LPLVARVESA GDEKASILLH 
NGMQADLIAV PPGMWGSALQ HFTGSKAHNI HFRELALAQG LSFSEHGFRR ADGTLLTCAT 
EEEVYAAIGL PWIPPELRED EGEFEAARAG TLPCLVELSD IRADLHLHST WSDGRADIRT 
MAEAARTRGY SHIAITDHSA YMGMTHGLDA ERLRAQRQEI AALNAEYAAR GIPFRILHGV 
EVDITPEGNL ALPDDVLAEL DIVVASAHIQ LRQSPEAATE RLIRAVRNPH VDIIGHPVGR 
MLGSRDGAPV DIDALAYAAA EHRVLLEVNS GPHRLDLDGA AVRRALASGA VITINSDAHH 
PDNLAWMRFG VVTARRGWAG AAQVANTWSD EALQEWLSRR