Gene Sde_2229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_2229
Symbol
ID	3964833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	2832761
End bp	2833822
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	46%
IMG OID	637921320
Product	hypothetical protein
Protein accession	YP_527701
Protein GI	90021874
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00330354
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCCAGT TTAGTCAATA TGAATGGACT TATTTAAGCC TACCCGCACG TTATTTTGCG 
TGGCGTATGC GTGGTAATGG GTTGAGTTGG ACCTACGAAA ATCATGTTGA TTTACACCAG 
CCCTATGACT TGGTTATTGC AACGTCTATG GTTGATCTAG CCACATTACG TGGCTTAAAC 
CCCCAGTTAC ATAATGTACC CGCGCTGCTT TATTTTCACG AAAATCAATT TGCTTACCCC 
GTATCTAAGC AGCAGCCCGA TATTGTTGCT GCGCAAATGG TTAGCTTGTA TTCAGCGCTT 
ACGGCGCAGC GTATTGTGTT TAATAGTGAG TATAACCGCT CCACTTTTTT CGACGGCTTA 
GCAACGCTAC TTAAAAAGTT GCCCGATCAT GTGCCTAAAG GGATTGTGGA AGAGCTTACA 
AATAAAAGCT CTGTGTTATT TGTGCCGCTA GCAAATGCAC CACAAGTGCA GGGTACGCGC 
TTCAAGCAAG CAAGCGCGAT TCGCAATATA GTGTGGAATC ACCGCTGGGA ATACGACAAG 
GGGCCGGAGC AATTATTGGC GTTTGCCACG GCTTTACCGC AAGGGTTGCC GATTAAAGTA 
CATGTAGTAG GGCAACAGTT TAGGCAAATG CCCGAAGCGT TTGCGCAAGT GCGTCAATGT 
TTGCAGGACA AAAAATATTT GGGCAAGTTT GGCTTTATTG CAAATAAAGC CGACTATATG 
GAGTTACTAG GGCAGAGTGA TTTTGTGTTA TCTACAGCGT TGCACGATTT TCAGGGGTTA 
TCTATTTTAG AAGCCGTTCA AGCTGGCTGT GTACCTATAG TGCCGAATCG CTTAGCGTAC 
CAAGAAATAT TCGATGCGCA GTACAGGTAC CCCTCACATT TAGATAAGGC TGCCGAAGAG 
GCTGTAGGGG TAATGGATAA ATTACAGCAA TTTTTAGCTA ACCCCACAAA GCAATTGCAT 
GCACCTTCTG TTACCGAGTT AGAGTGGCGG ACGCTCAAGC CGGCTTACGA ACACATAATT 
GAGCATTGCA GAGATTTAAA AACGGGGCGT CAGGGGGTAT GA

Protein sequence

MAQFSQYEWT YLSLPARYFA WRMRGNGLSW TYENHVDLHQ PYDLVIATSM VDLATLRGLN 
PQLHNVPALL YFHENQFAYP VSKQQPDIVA AQMVSLYSAL TAQRIVFNSE YNRSTFFDGL 
ATLLKKLPDH VPKGIVEELT NKSSVLFVPL ANAPQVQGTR FKQASAIRNI VWNHRWEYDK 
GPEQLLAFAT ALPQGLPIKV HVVGQQFRQM PEAFAQVRQC LQDKKYLGKF GFIANKADYM 
ELLGQSDFVL STALHDFQGL SILEAVQAGC VPIVPNRLAY QEIFDAQYRY PSHLDKAAEE 
AVGVMDKLQQ FLANPTKQLH APSVTELEWR TLKPAYEHII EHCRDLKTGR QGV