Gene Jann_2986 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_2986
Symbol	deoA
ID	3935456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	3005149
End bp	3006459
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	68%
IMG OID	637905356
Product	thymidine phosphorylase
Protein accession	YP_510928
Protein GI	89055477
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0213] Thymidine phosphorylase
TIGRFAM ID	[TIGR02643] thymidine phosphorylase [TIGR02644] pyrimidine-nucleoside phosphorylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.433587
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG CGCGCGCCAT TCTGACGAAG CTGCGCCAGG GCGACCGCCT GACGGAGGCA 
GAGGTGTTCT GGTTCGCCGA AGGGCTTGCG ACCGGCGACG TCACCGACGC TCAGGCAGGC 
GCGTTTGCCA TGGCCGTGTG CCAAAACGGA CTGGGCGAGG AGGGCCGGGT GCAACTGACC 
CGCGCGATGC GAGAGACGGG CCGCGTGATG GCATGGCACC TCGACGGGCC GGTGATCGAC 
AAACATTCAA CGGGTGGCGT AGGGGATTGC GTGTCGCTGC TGCTGGCACC TGCGCTGGCC 
GCTTGCGGAG CGTTCGTGCC AATGATTTCT GGGCGCGGTT TGGGGCACAC GGGCGGCACG 
CTGGATAAGT TGGAGGCCAT TCCGGGCTAC AACACAGACG TCTCCCCCGA TGATCTGCAA 
GAGATCGTGG CTGATATCGG CTGTGCCATC GTGGGCGCAT CGGGTGATAT CGCGCCCGCT 
GACAAGCGGC TTTACGCGGT GCGGGACGTG ACGGCCACCG TCGCCTCGGT CGATCTGATC 
ACGGCGTCGA TCCTGTCAAA AAAGCTCGCC GCCGGGTTGG AGGCATTGGT TCTGGATGTG 
AAGGTCGGCT CGGGCGCGTT CATGGGCACG GAGGCGGAGG CGTTGGGCCT GGCGCAAGCG 
CTGGTCGCGA CGGCACAAGG CGCGGGGTGC ATGACCACGG CGTTGGTCAC CGACATGAAC 
CAACCCCTGG CCAGCAGCGC GGGCAATGCG TTGGAACTGG CCGAGGTGAT GCAGGTTTTG 
ACCGGAGCGG CGAAGGATAC GGCCCTGGAG CACCTGACCG TTGCATTGGG CGGAGAGGTC 
CTGGCCCTGG GCGGTCTGGC GGCGGATGCG AGCGATGGCG AGGGCCGGAT CAGACGCGCG 
CTGGCAGGCG GAGAGGCCGC GCGGGTCTTC GCAGAGATGG TGGCCGAACT GGGCGGCCCG 
GTCGATTTCG TGGAGCGCTG GCCCGACAGG TTGCCGGCCG CGCCGGTGAT GATGGATGTG 
CATCCGGGAC AGGCGGGATA CGTCACCGCC ATCGACACCC GCGCCCTGGG AGAGATCGTG 
GTGCATCTGG GCGGCGGCCG CCTGCGGGAG GACGACCGGA TCGACCCGGC GGTTGGCCTG 
TCGGACATCG CGCGGCTGGG CACGCGGGTG GACGATGTGA CACCCCTTGC GCGCATGCAC 
ACAGCCGATG AGGACGAAGG CCGCGCGCTG GCCGCCAAGC TGCGCCGCGC ATTCACCCTG 
TCGGACGCTG CGATAGATAC GCCGCCCCTG ATCCATGAGA GGATTGCCTG A

Protein sequence

MSDARAILTK LRQGDRLTEA EVFWFAEGLA TGDVTDAQAG AFAMAVCQNG LGEEGRVQLT 
RAMRETGRVM AWHLDGPVID KHSTGGVGDC VSLLLAPALA ACGAFVPMIS GRGLGHTGGT 
LDKLEAIPGY NTDVSPDDLQ EIVADIGCAI VGASGDIAPA DKRLYAVRDV TATVASVDLI 
TASILSKKLA AGLEALVLDV KVGSGAFMGT EAEALGLAQA LVATAQGAGC MTTALVTDMN 
QPLASSAGNA LELAEVMQVL TGAAKDTALE HLTVALGGEV LALGGLAADA SDGEGRIRRA 
LAGGEAARVF AEMVAELGGP VDFVERWPDR LPAAPVMMDV HPGQAGYVTA IDTRALGEIV 
VHLGGGRLRE DDRIDPAVGL SDIARLGTRV DDVTPLARMH TADEDEGRAL AAKLRRAFTL 
SDAAIDTPPL IHERIA