Gene Tery_0284 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_0284
Symbol
ID	4242139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	438503
End bp	439606
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	35%
IMG OID	638105623
Product	glycine oxidase ThiO
Protein accession	YP_720238
Protein GI	113474177
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00610276
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGTCAAT CAAACAAAAT CATCATTATT GGTGGCGGTA TTATCGGTAT ATCAATAGCA 
ATAGAACTAA AGTTACGCGG AGCTAAAGTA ACAGTTATTA GCCGAGATTT TCAGCAAATT 
GCCACAAATG CTGCTGCCGG AATGTTAGCC CCCCAAGCTG AAGCTATTCC CCCTGGAAAA 
ATGTTAGATT TATGTTTAAA AAGTCGAACA TTATATCCAG AATGGGTACA AAAAATAGAA 
TCAATTAGTG GTTTAGAAAC TGGTTATTGG TCTTGTGGAA TTTTATCCCC AGTTTATGCT 
CTAAAAGATA GAGAAAATTA TGCTTTACCA AGCCTGAATT ATCAATGGCT AAATCAAGTA 
GCAATCCATC AATATCAACC AGGATTAAGT CCTGAAGTAA TTGGGGGCTG GTTTTACCCT 
CAAGATGGGC AAGTAGATAA TCGTTATTTA TACCAATCAA TTATAGCAGC AGCTAAAGAA 
TTGAAAGTTG AAATTCAATC AGGAATTGTG ACAGAAATAA TTCGGAAAAA AGGAAAAATT 
AAAAGTCTCA AAACATCAAT AGGTGAAATA GAAGCAGAAC ATTATGTCTT AGCTACAGGT 
GCATGGTCGC AGGAGTTATT ACCAATTCCC ATTTTTCCGA CAAAAGGGCA AATGTTATCA 
TTAAAAGTGC CCTCATATGT AAGTAGAGAA AATCTATCTT TGCAACAAGT TATATATGGA 
AGTCACTGTT ATATTGTACC CCGCAAAGAT GGCAGAATAA TTATTGGTGC AACTTGTGAA 
AATATCGGAT TTGTTGATGG AAATACTCCG GTAGGAATTC AACAATTATT AGGAAATGCA 
ATTAGATTAT ATCCAGTGTT AAGGGATTAC GAAATCTTAG AATTTTGGTG GGGTTTTCGT 
CCTAATACTC CTGATGAAAT GCCGATATTA GGAAAAAGTA ATTATGATAA TTTGACTTTA 
GCAACTGGGC ATTATCGAAA TGGAATTTTA TTAGCACCTG TAACAGGAAT GTTGATAGCT 
GATTTAATTT GGAATAATCA ATCTAACTCC TTATTGACAG CTTTTAATTA TTCTCGGTTT 
ATGGAAGTCG GAAGTCAAGT TTGA

Protein sequence

MSQSNKIIII GGGIIGISIA IELKLRGAKV TVISRDFQQI ATNAAAGMLA PQAEAIPPGK 
MLDLCLKSRT LYPEWVQKIE SISGLETGYW SCGILSPVYA LKDRENYALP SLNYQWLNQV 
AIHQYQPGLS PEVIGGWFYP QDGQVDNRYL YQSIIAAAKE LKVEIQSGIV TEIIRKKGKI 
KSLKTSIGEI EAEHYVLATG AWSQELLPIP IFPTKGQMLS LKVPSYVSRE NLSLQQVIYG 
SHCYIVPRKD GRIIIGATCE NIGFVDGNTP VGIQQLLGNA IRLYPVLRDY EILEFWWGFR 
PNTPDEMPIL GKSNYDNLTL ATGHYRNGIL LAPVTGMLIA DLIWNNQSNS LLTAFNYSRF 
MEVGSQV