Gene TM1040_2800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2800
Symbol
ID	4076568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2962121
End bp	2963587
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	59%
IMG OID	638008125
Product	AMP nucleosidase
Protein accession	YP_614794
Protein GI	99082640
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0775] Nucleoside phosphorylase
TIGRFAM ID	[TIGR01717] AMP nucleosidase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.955099
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGATG TAAAAACACC CGACCTGCCC GCTGCCGAAA GCTTTACCGA CGCCAAAGCG 
GCCGTAGCGC GCCTGATTGA GCTCTACGAT AGCGCAACCA ATTTTCTCTG TGACGAGTTT 
ATTGCCGCGA TGAGCGCCGG AGCTGCGCCG AGCAGCCGCA TGCGAGCCTA CTATCCCGAA 
GTGCGCTTCA CCACCACGAC CTACGCGCAG GTGGACAGTC GCCTGAGCTT TGGTCATGTG 
GCCGATCCCG GCATCTATTC CACCACCGTC ACACGGCCCG ATCTGTTTCG TCATTACCTG 
GAGCAGCAAA TCGGGTTGCT GATCAAGAAC CACGACCAGC CGGTGACAGT GGGGGTATCG 
CAAACGCCGA TGCCAGTGCA TTTTGCCGTC GCCTCGCGCC CGGGACTGAC AGTACCGCAG 
GAGGGCGCCG CGCGCTTCAC CCTGCGCGAT GTCTTTGATG TGCCGGATCT CGCCACAACA 
AACGACGACA TCGTAAATGG CACCTATGTG CCCGAAAACG GTGTCGGTCC GCTGTCGCTC 
TTTACCGCCC AGCGCGTCGA CTACTCTCTG GCGCGTCTGT CACACTATAC CGCGACCGAC 
CCGGAGCATT TCCAGAACCA TGTGTTGTTC ACCAACTACC AGTTCTACGT GACAGAGTTC 
GAAGCCTATG CGCGCGAACA ACTGGCCGAT CCAGACAGCG GCTACACCAG TTTTGTCTCC 
ACCGGAAACG TCGAGATCAC CAAAGCGGAT GGAGAGCTGC CAGCATCGCT CAAAATGCCG 
CAGATGCCGA CTTACCACCT GAAACGCCCC GACGGAAACG GCATCACACT GGTCAACATT 
GGCGTTGGCC CGTCAAACGC GAAAACCGCA ACCGATCACA TTGCGGTCCT GCGCCCACAC 
GCCTGGCTGA TGGTGGGCCA TTGTGCGGGT CTGAGGAACT CTCAGGCATT GGGAGATTTT 
GTGCTTGCTC ATGCCTATCT GCGCGAGGAT CACGTTCTGG ATGACGACCT GCCGGTCTGG 
GTACCGATCC CGGCATTGGC AGAAATTCAG GTCGCGCTCG AGGAAGCCGT GGCAGAGGAA 
ACCGGACTCG AAGGCTATGA TCTCAAGCGG ATCATGCGGA CTGGCACCGT TGCAAGCCAC 
GACAACCGCA ACTGGGAACT GCGCGACCAG TCTGGTCCCG TGCAACGTCT GAGCCAATCC 
CGTGCGATTG CTCTTGATAT GGAGAGCGCC ACCATCGCCG CCAATGGCTA TCGGTTCCGG 
GTTCCCTACG GCACGCTCCT GTGCATTTCC GACAAGCCCC TGCACGGTGA ATTGAAGCTG 
CCCGGCATGG CGTCCGATTT CTATCGCACG CAGGTGTCGC GGCATCTGCT GATCGGGATC 
AAGGCAATGG AGCGACTGAG AACAATGCCG CTCGAGCGTC TCCACAGCCG GAAACTGCGC 
TCTTTTGACG AAACGGCCTT CCTGTAA

Protein sequence

MNDVKTPDLP AAESFTDAKA AVARLIELYD SATNFLCDEF IAAMSAGAAP SSRMRAYYPE 
VRFTTTTYAQ VDSRLSFGHV ADPGIYSTTV TRPDLFRHYL EQQIGLLIKN HDQPVTVGVS 
QTPMPVHFAV ASRPGLTVPQ EGAARFTLRD VFDVPDLATT NDDIVNGTYV PENGVGPLSL 
FTAQRVDYSL ARLSHYTATD PEHFQNHVLF TNYQFYVTEF EAYAREQLAD PDSGYTSFVS 
TGNVEITKAD GELPASLKMP QMPTYHLKRP DGNGITLVNI GVGPSNAKTA TDHIAVLRPH 
AWLMVGHCAG LRNSQALGDF VLAHAYLRED HVLDDDLPVW VPIPALAEIQ VALEEAVAEE 
TGLEGYDLKR IMRTGTVASH DNRNWELRDQ SGPVQRLSQS RAIALDMESA TIAANGYRFR 
VPYGTLLCIS DKPLHGELKL PGMASDFYRT QVSRHLLIGI KAMERLRTMP LERLHSRKLR 
SFDETAFL