Gene Tery_5003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_5003
Symbol
ID	4246658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	7644229
End bp	7645377
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	40%
IMG OID	638109814
Product	phosphonate metabolism protein PhnM
Protein accession	YP_724390
Protein GI	113478329
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3454] Metal-dependent hydrolase involved in phosphonate metabolism
TIGRFAM ID	[TIGR02318] phosphonate metabolism protein PhnM

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.849449
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACTT ATCTTACCCA CTGTCGTTTA ATTACTAATA ATGCAGTTGT TGATGATGCT 
GCTGTGTTAA TTGAAGATGG ATATATTGTC GCTATCAATC CCGAATTTAC TAACAATGTT 
GAATCTATTT CCCTAAATGG TCAATATTTA TTACCTGGGT TAGTAGATCT TCATTGCGAT 
GCCATTGAAA AAGAAATTGA ACCTCGTCCC AATGCTTTTT TCCCTATGGA TTTTGCGATC 
GCTCAAATAG ATCGAAATAA TGCTGCTGTT GGTATTACCA CACCTTTCCA TGCTATCTCC 
TTTGCCTATG AAGAATTTGG CCTTCGCAAC AATGAAAAAG CAGCTCAAAT TGTGCGTTCC 
CTCCACAATT ATCAGCCCCA AGCATTAGTT AATAACCGGG TCCATTGTCG CTACGAAATT 
ACCGACCCTA CAGGGCTACC CATTTTGCTT AATCTGTTGC AGTCAGATGA CATTCATTTG 
ATTTCTTTTA TGGACCATAC TCCAGGACAG GGACAATTTA AAAATGTGCA AGCATACCAG 
GATTATTTGG CCCGCGCATA CAACAAATCT GCTACAGAAG TCGAAGCAAT AGCCCTCAAA 
AAAATCGATC AAGGAGCAGA TGCTCTGGAA CGGGTAAAAA CTTTAATTTC CAAAGCTTTA 
TCTTTAGGAG TACAAGTTGC TAGTCATGAT GATGATAGCC CAGAGAGAAT TTCTAGTATG 
CAGGCTTTGG GAATACATCT TAGTGAATTT CCGATCAATC TTGAAACGGC CCAAGCTGCT 
AAAAAAGCCG GACTCCAAAC CATATTTGGT GCCCCTAATT TACTACGGGG ACAAAGTCAG 
AGTGGTTCAA TAAAAGCCAT AGATGCAATT AAACATCACG TGGGAGATAT TCTTTGTGCA 
GATTACTCAC CTGCAAGTTT GCTGGCAGCA GCATTTCGAA TTCCTGAATT ACTTGGTTGG 
TCATTACCAG ATGCAATAGC CCTTGTTACA CACAACCCTG CACAAGCTGT AAATCTTAGT 
GACCGCGGTG AAATTGCTAT AGGCAAACGG GCTGATTTAA TTGTTGTACA GTGTCCTCAT 
GGCTTTCCTC AAGTAACAAC TACTTGGGTT GGGGGGCGAA TTGTTTACCA ATGTCATTAC 
TCAAGATAA

Protein sequence

MKTYLTHCRL ITNNAVVDDA AVLIEDGYIV AINPEFTNNV ESISLNGQYL LPGLVDLHCD 
AIEKEIEPRP NAFFPMDFAI AQIDRNNAAV GITTPFHAIS FAYEEFGLRN NEKAAQIVRS 
LHNYQPQALV NNRVHCRYEI TDPTGLPILL NLLQSDDIHL ISFMDHTPGQ GQFKNVQAYQ 
DYLARAYNKS ATEVEAIALK KIDQGADALE RVKTLISKAL SLGVQVASHD DDSPERISSM 
QALGIHLSEF PINLETAQAA KKAGLQTIFG APNLLRGQSQ SGSIKAIDAI KHHVGDILCA 
DYSPASLLAA AFRIPELLGW SLPDAIALVT HNPAQAVNLS DRGEIAIGKR ADLIVVQCPH 
GFPQVTTTWV GGRIVYQCHY SR