Gene CA2559_04135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CA2559_04135
Symbol
ID	9296316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Croceibacter atlanticus HTCC2559
Kingdom	Bacteria
Replicon accession	NC_014230
Strand	+
Start bp	940065
End bp	941402
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	33%
IMG OID
Product	putative deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_003715591
Protein GI	298207412
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.414308
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTGGG AACAACTATT ATCTCTTAAG CGTTTTGGAG ATACAAATAA GCGTTTAAGA 
AAAGAACAAG ACGATACACG ATTGGGCTTT GAGGTAGATT ACGATCGTAT TATATTTTCC 
AGCTCTTTTA GGAGTTTGCA GGATAAAACT CAAGTTATCC CATTGTCTAA AACAGATTTT 
GTGCACACAA GATTAACACA CAGTTTAGAG GTAAGTGTTG TGGGGCGAAG TTTAGGACGA 
GTTGTTGGTA AGAAGCTTTT AGAAAAACAC CCACATCTTT CTGAGACGTA TGGGCATCAT 
TTTAATGATT TCGGGGCTAT TGTTGCTGCA GCATCTTTAG CACACGATAT TGGAAATCCG 
CCGTTTGGTC ACTCTGGCGA AAAGGCTATA GGAGACTTTT TTAAATCTGG AAAAGGAAAT 
AGATTTAAAG ACTCTCTTAC AAACGTTCAA TATCAAGACC TTTGTACCTT TGAAGGAAAC 
GCTAACGGAT TTAAGCTTTT AACTGAAACA AAAAACGGAG TAACTGGCGG TTTAAGGTTA 
TCTTACTCAA CCTTGGGTGC TTTTATGAAA TACCCAAAAG CTTCGTTACC TTATAAACCA 
ACAACTCAAA TTCACCATAA AAAATATGGT TACTTCCAAA GTGAGCAGGA AGTCTTTAAT 
GATGTAGTTA AGGATTTAGG ATTAATTTCT GAAACTGTAA AAGATTCAGA AACTTACAAA 
AGACATCCGT TAACGTTTTT AGTTGAAGCC GCAGATGATA TCTGCTATAC AATTATAGAC 
TTTGAAGATG GTATAAATTT AGGTTTAATA GATGAGGAGT TTGCTTTAGA ATATCTAATT 
AATTTGGTTA AGGATAAGAT AGACACAAAA AAATATCATC AACTCGTTAC CAAATCTAAT 
AGAGTAAGTT ATTTAAGAGC ATTAGCTATT GGAGTGCTTA TTGAAGAGGC AGCTTCAATT 
TTTATTGCAA ATGAAGAAGC TATACTTAAA GGTGACTTTA GTTCTGCATT ATTAGATAAG 
TCACAGTACA CGGCACAAAT AGATGATATT ATAAAAATTA GCATTAACAA TGTATATCAA 
TCTCAAGACG TCTTAGAGAA GGAGATATTG GGCTACCAAG TAATCGGAAC ATTATTGGAA 
GTTTATACAG ATGCCGTGTT TAGTAAGAAA AACAACACAA ATACAAATTT TAATTCATTG 
ATTTTGAAAG GTTTTCTTAA AGAATTCGAC TTAAATCAAG ATGATTATTC TATTTTAATT 
GAAATTTCTT CACTTGTAGC CTCTTATTCA GACAGTGAAG CCCTTAGAAT TTACCAGAAA 
ATTAAGGGCA TGTTATAG

Protein sequence

MNWEQLLSLK RFGDTNKRLR KEQDDTRLGF EVDYDRIIFS SSFRSLQDKT QVIPLSKTDF 
VHTRLTHSLE VSVVGRSLGR VVGKKLLEKH PHLSETYGHH FNDFGAIVAA ASLAHDIGNP 
PFGHSGEKAI GDFFKSGKGN RFKDSLTNVQ YQDLCTFEGN ANGFKLLTET KNGVTGGLRL 
SYSTLGAFMK YPKASLPYKP TTQIHHKKYG YFQSEQEVFN DVVKDLGLIS ETVKDSETYK 
RHPLTFLVEA ADDICYTIID FEDGINLGLI DEEFALEYLI NLVKDKIDTK KYHQLVTKSN 
RVSYLRALAI GVLIEEAASI FIANEEAILK GDFSSALLDK SQYTAQIDDI IKISINNVYQ 
SQDVLEKEIL GYQVIGTLLE VYTDAVFSKK NNTNTNFNSL ILKGFLKEFD LNQDDYSILI 
EISSLVASYS DSEALRIYQK IKGML