Gene Sare_4250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4250
Symbol
ID	5704382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4822316
End bp	4824229
Gene Length	1914 bp
Protein Length	637 aa
Translation table	11
GC content	68%
IMG OID	641273669
Product	glucosamine--fructose-6-phosphate aminotransferase
Protein accession	YP_001539022
Protein GI	159039769
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0449] Glucosamine 6-phosphate synthetase, contains amidotransferase and phosphosugar isomerase domains
TIGRFAM ID	[TIGR01135] glucosamine--fructose-6-phosphate aminotransferase (isomerizing)

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0388234
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0232179
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGTGGAA TCGTGGGATA CGCCGGCGAG CGTCCGGCGC TGGGCATCGT GCTGGATGGG 
CTGCGACGGC TGGAGTACCG CGGCTACGAC TCAGCAGGAG TCGCCATCAC CTGCGGGGAC 
GAACTGCTGG CGGAGAAGAG GGCCGGAAAG TTGGCCAACC TGGAGAAGGT GCTCTCCGAA 
CGCTCCGCGC AGGACCCGGA GGCGTGCGGC GCGTCCCCCA TCGGGATCGG GGACGGTACC 
ACCGGTATCG GCCACACCCG CTGGGCCACC CATGGCGGCC CCACGGACCG TAACGCACAC 
CCCCACCTGT CCCCCGACGG GCGGATTGCC GTGATCCACA ACGGCATCAT CGAGAACTTC 
GCGAAGCTGC GCGCCGAACT GGAAGCCGAC GGCGTCCAGT TCGTCAGCGA CACCGACACC 
GAATGCGCCG TCCACCTGCT CGCCATCGCC CTCGCAGACC TGCGCGCGGC CGGCCATCCG 
GACGGGCCGC AGCTGCTGTC CGCCGGGATG CGGGTGGTGT GCCAGCGACT TGAGGGGGCG 
TTCACCCTGC TCGCGGTGGA TGCCGGTATC CCGGGGGCCG TGGTCGGTGC CCGGCGCAAC 
TCGCCACTGG TCGTCGGCCG CGGCGCCGGT GAGAACTACC TGGCCAGCGA TGTCACCGCG 
TTCATCGAGC ACACTCGGGA CGCGGTGGAG CTGGGTCAGG ACCAGATCGT GTTGATCACC 
AGCGACAGCA TCGAGATCAC CGATTTCGCC GGGCAGCCCG CGAGTGGCAA GGACTTCCAC 
ATCGACTGGG ACTCCTCGGC CGCGGAGAAG GGCGGCTACG ACTGGTTCAT GCTCAAGGAG 
ATCGAGGAGC AGCCCCAAGC CGTGGCGGAC ACGTTGCTCG GTCGGCTCAC CGAGAGCGGC 
GAGATCATGC TCGACGAGGT CCGGCTGAGC GACCAGGACC TGCGCGACGT CGACAAGATC 
TTCATTGTTG CCTGCGGCAC CGCATACCAC TCCGGCATGG TCGCCAAGTA CGCCATCGAA 
CACTGGACCC GGATCCCCTG CGAGGTGGAG CTGGCCAGCG AATTCCGCTA CCGCGACCCG 
GTGCTCGACC GGTCCACCCT CATCGTGGTG ATCTCGCAGT CCGGCGAGAC GATGGACACC 
CTGATGGCGC TGCGGCACGC CAAGGAGCAG AAGGCCCGGG TACTGGCCAT CTGCAACACC 
AACGGCTCCA CCATCCCCCG TGAGTCCGAC GCGGTCCTCT ACACCCACGG CGGCCCGGAG 
ATCGCCGTCG CCTCCACCAA GGCGTTCCTC ACCCAGCTCG TCGCCTGCTA TCTGATCGGC 
CTGCACCTCG CGCAGGTGCG CGGGATCAAG TTCGCCGACG AGGTAGCCGC CGTGGTCAAC 
CAGCTGCACC AGATGCCCGG CAAACTGCGT GAGCTGCTGG GCCGGATCGA GCCGGTACGC 
GAGCTGGCCC GCGAGTTGAA GGGCCAGCCG ACCGTGCTGT TCATCGGCCG CCACGTCGGA 
TACCCGGTGG CGCTGGAAGG TGCGCTCAAG CTCAAGGAAC TGGCCTACAT GCACGCCGAG 
GGGTTCGCGG CCGGCGAACT CAAGCACGGC CCGATCGCGT TGATCGACAA GGGCACCCCG 
GTGATCTGTG TCGTACCGTC GCCGGTGGGT CGGGGCATGC TGCACGACAA GGTCGTCTCC 
AACATCCAGG AGGTGCGGGC CCGTGGCGCC CGCACGATCG TGATCGCGGA GGAGGGCGAC 
GAGGCGGTCG TCCGCTTCGC CGACCACCTG ATCTATGTAC CGCGTACGCC GACTCTGCTC 
ACGCCGCTGG TGACCACCGT GCCGCTGCAG GTCTTCGCCG CGGAGATCGC CGCAGCGCGT 
GGCCACGATG TCGATCAGCC CCGCAACCTG GCGAAGTCCG TGACAGTTGA GTGA

Protein sequence

MCGIVGYAGE RPALGIVLDG LRRLEYRGYD SAGVAITCGD ELLAEKRAGK LANLEKVLSE 
RSAQDPEACG ASPIGIGDGT TGIGHTRWAT HGGPTDRNAH PHLSPDGRIA VIHNGIIENF 
AKLRAELEAD GVQFVSDTDT ECAVHLLAIA LADLRAAGHP DGPQLLSAGM RVVCQRLEGA 
FTLLAVDAGI PGAVVGARRN SPLVVGRGAG ENYLASDVTA FIEHTRDAVE LGQDQIVLIT 
SDSIEITDFA GQPASGKDFH IDWDSSAAEK GGYDWFMLKE IEEQPQAVAD TLLGRLTESG 
EIMLDEVRLS DQDLRDVDKI FIVACGTAYH SGMVAKYAIE HWTRIPCEVE LASEFRYRDP 
VLDRSTLIVV ISQSGETMDT LMALRHAKEQ KARVLAICNT NGSTIPRESD AVLYTHGGPE 
IAVASTKAFL TQLVACYLIG LHLAQVRGIK FADEVAAVVN QLHQMPGKLR ELLGRIEPVR 
ELARELKGQP TVLFIGRHVG YPVALEGALK LKELAYMHAE GFAAGELKHG PIALIDKGTP 
VICVVPSPVG RGMLHDKVVS NIQEVRARGA RTIVIAEEGD EAVVRFADHL IYVPRTPTLL 
TPLVTTVPLQ VFAAEIAAAR GHDVDQPRNL AKSVTVE