Gene Tery_4474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4474
Symbol
ID	4246127
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	6906691
End bp	6907881
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	37%
IMG OID	638109357
Product	N-acetylglucosamine 6-phosphate deacetylase
Protein accession	YP_723934
Protein GI	113477873
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0902542
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACTTAA CTACTAAAAT TATTAATGCT AAGGTCCCTG GTTATCAAAA CCTACAGCAA 
ATTTTCATCA ATTCTACTGG CAATATTGAG AAAATTATCC CTCAAAATGG AGAGGCTTTG 
CCTAGCACAT CTACTACTAT TGATGTGGAA CAAGACTGGG TTTCTCTCGG AGGGTTTGAT 
TTACAAATTA ATGGTGCTTT GGGTTTACCT TTTCCGGAAG TAGATGAAAC TTCAATAACT 
AAAATACATG AAATTTGTCA ATATTTATGG CACCAGGGAA TAGATGCTTT TTTGCCTACT 
ATTGTCACAA CTTCTATAGA TAATATTCAG CGATCGCTCC AAATCTTCGA CTATTTGGCC 
TCACAACCCC AAGAACCAAA AACAGCTAAA ATTTGGGGCG TACATTTGGA AGGGCCTTTT 
TTGCATCCAG AAAAGCGGGG CGCTCACCCT CAGAAATATT TGCTACCATT AAGCATCGAA 
AATGTCAAGC AGGTAATCGG CGATTATAGT CAGACAGTTA AAATTATCAC TTTAGCACCG 
GAATTAGACA GTACAGAAAC AATAATTCCT TACCTAAAAA ATCTAGGAAT TATAGTTAGT 
TTAGGGCATT CTCAGGCGAC AGCAAATCAA GCAGAAACAG CTTTTAAATT AGGAGCTTCA 
ATGGTAACTC ATGCCTTCAA TGCTATGGGC AGTTTACATC ATCGAAAACC AGGATTATTA 
GGAGCAGCAA TTACAAATTC TGAGGTTATG TGTGGTTTAA TTGCTGATGG TCAGCATGTC 
TGTTCAACAA TGATAGAAAT TTTGTTAAAA GCAAGTCAAT ATCAGCAAGG AATATTTTTG 
GTTAGTGATG CTTTGGCGCC TTTGGGATTA CCTGATGGAA TTTACCCTTG GGATGCTAGA 
GAAATAGAAG TTAAAAATGG TACGGTTAGA TTACAAGATG GAATATTAGC GGGAACAACT 
TTACCTTTAT TGGTTGGAGT TAATAATTTG GTAAAGTGGG GGGTTTGTGA TATTGAAACT 
GCAATTAATT TAGGGACTAT TGCACCTCGG AAAGCTTTAG GAATAGACAG TAAAATTATT 
GGGAAGTCTG GAAATAGTTT ATTAAGGTGG CGGGTAAATA GTCAGTTATT TAATAAGGAG 
ATAGAGTTGG TTTGGCAGAG AATATTTGGA GTTGATTACA TAGATAGATA A

Protein sequence

MNLTTKIINA KVPGYQNLQQ IFINSTGNIE KIIPQNGEAL PSTSTTIDVE QDWVSLGGFD 
LQINGALGLP FPEVDETSIT KIHEICQYLW HQGIDAFLPT IVTTSIDNIQ RSLQIFDYLA 
SQPQEPKTAK IWGVHLEGPF LHPEKRGAHP QKYLLPLSIE NVKQVIGDYS QTVKIITLAP 
ELDSTETIIP YLKNLGIIVS LGHSQATANQ AETAFKLGAS MVTHAFNAMG SLHHRKPGLL 
GAAITNSEVM CGLIADGQHV CSTMIEILLK ASQYQQGIFL VSDALAPLGL PDGIYPWDAR 
EIEVKNGTVR LQDGILAGTT LPLLVGVNNL VKWGVCDIET AINLGTIAPR KALGIDSKII 
GKSGNSLLRW RVNSQLFNKE IELVWQRIFG VDYIDR