Gene CA2559_07585 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CA2559_07585
Symbol
ID	9297013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Croceibacter atlanticus HTCC2559
Kingdom	Bacteria
Replicon accession	NC_014230
Strand	+
Start bp	1685934
End bp	1687073
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	32%
IMG OID
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_003716276
Protein GI	298208097
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.547919
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTACAAC TCTCTGTAAT CATACTTAAT TACAATGTCA AGCATTTTTT AAAGCTTTGC 
CTACAAAGTG TGGTGCAGGC TAAAGAAAAT ATACAAGCCG AAATTATTGT TGCAGACAAC 
GCATCTAAAG ATGGAAGTAT GGAAATGGTT GCTCAGGATT TTCCAAATGT TATAAGACTC 
GAAAATAAAG AAAACTTAGG GTTTAGTAAA GCTAATAATC TAGCTGTAAA AAAAGCTAAA 
GGTAAATACA TCTGTATCTT AAATCCAGAT ACTGTAGTGC CTGAGCAAAT CTTCTCAAAT 
TTATTGAAGT TCGTTAAAAC AGTTCAAGAT TTTGGAGCGG TAGGAGTAAA GTTAATCGAT 
GGTAAAGGGC AATTTTTACC AGAAAGCAAA CGGCAAATAC CTACTCCTAA AGTGGCCTTT 
CAAAAAATGG TAGGCAACGC CACTAACTAT TATGCAAGTA ATTTAGAATC TAATGATATT 
GGTTGTGTAG ATGTTCTTGT AGGCGCATTT ATGTTTATGT CCAGACAGCG TTATTTACAA 
GTTGGAGGTT TTGATGAAGA CTACTTTATG TATGGTGAAG ATATAGACCT TAGCTACAAA 
CTACTTAAGT CTGGTTATAA AAACTACTAT TACGGAAAAG ATTCAGTAAT TCATTTTAAA 
GGAGAAAGTA CTACTAAAGA TGAAGTGTAT AGAGCACGTT TTTATGGTGC AATGCAACTT 
TTTTATAAAA AACATTTTAG CAATAGTAAG TTTACTAATC TAATTGTAAA AGCTGCACTC 
AAAGTAGTTA AGAAGGCAAA TAAGGCTCAA GGTTTAGATA CAGATAAGGA AATATCTTCA 
AATTTATTTA TCTATATCGG TAATTCTTCA GACTGTGTTG CCATCTTGTC TAAACTAAAA 
AATAAGCAAG TACAACATCT TTCTTTAAAA GAGCTACAGA AGCTAACTTT AAAAAATTCA 
CAGCTGTTTT TAGACTCTCA ATTTTTTAAT TTCAAAGAAA TTATTAGTCT TCTAGAGCAG 
TATGGGCACC ATAATAATAC ATTTAGGATA AAGTTGAAAT CTTCTAATGT GTTGATTGGT 
AGTGATACTA GCACAGGAAA AGGTGAGGTT TTGGTTTTAG AACTAGATAA AATTCAATAA

Protein sequence

MVQLSVIILN YNVKHFLKLC LQSVVQAKEN IQAEIIVADN ASKDGSMEMV AQDFPNVIRL 
ENKENLGFSK ANNLAVKKAK GKYICILNPD TVVPEQIFSN LLKFVKTVQD FGAVGVKLID 
GKGQFLPESK RQIPTPKVAF QKMVGNATNY YASNLESNDI GCVDVLVGAF MFMSRQRYLQ 
VGGFDEDYFM YGEDIDLSYK LLKSGYKNYY YGKDSVIHFK GESTTKDEVY RARFYGAMQL 
FYKKHFSNSK FTNLIVKAAL KVVKKANKAQ GLDTDKEISS NLFIYIGNSS DCVAILSKLK 
NKQVQHLSLK ELQKLTLKNS QLFLDSQFFN FKEIISLLEQ YGHHNNTFRI KLKSSNVLIG 
SDTSTGKGEV LVLELDKIQ