Gene Sde_2091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_2091
Symbol
ID	3967475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	2675313
End bp	2676428
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	49%
IMG OID	637921181
Product	chorismate synthase
Protein accession	YP_527563
Protein GI	90021736
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGAA ACACCTTTGG TAAATTATTC ACCGTAACCA CATTTGGCGA AAGCCACGGT 
TTGGCGCTAG GCGCCATAAT TGATGGTTGC CCACCGGGAA TTGAATTGTC TGAAGAAGAT 
TTACAGTTAG ATTTGGATCG ACGCAAACCG GGTACCTCGC GCTATACAAC ACAGCGTAAA 
GAGGCCGATC AGGTAAAGAT TTTATCTGGT GTATTCGAGG GCAAAACAAC GGGTACGCCA 
ATAGGCTTGC TAATCGAAAA CACGGATCAG CGCTCGAAAG ACTACGGCAA AATTAAAGAC 
CAATTTCGCC CAGCTCATGC CGATTACACT TATATGCAAA AGTACGGCAT TAGGGATTAC 
AGAGGCGGCG GTCGATCATC AGCTCGCGAA ACCGCAATGC GGGTTGCAGC GGGTGCCGTT 
GCCAAAAAGG TACTTGCCAA CCTGTGGGGT ATAAAAATTC GCGGGTATTT GTCGCAACTG 
GGGCCAATTA AAGCTGAGTT GTTAGATTGG AACGAAGTTG AGCAAAACCC GTTTTTCTGC 
CCCGATAAGT CGAAAGTTCC CGAAATGGAG GCTTATATGC AGGCGCTAAA TAAAGAGGGT 
AACTCGGTTG GTGCCAAAAT TACCGTCGTT GCCGAAAACA TGATTCCTGG TTTGGGAGAG 
CCTGTTTTCG ATCGTATTGA TGCAGATTTG GCCCACGCGC TAATGGGTAT TAACGCGGTT 
AAAGGTGTTG AAATAGGTGC AGGCTTTGCT TGTGTTGCTC AAAAAGGCAC AGAGCATCGC 
GACGAAATAA CCCCAGAAGG GTTTAAGTCG AATCAAGCCG GTGGGGTGCT TGGCGGTATT 
TCTACCGGGC AGGATTTAAT TGCGTCTTTA GCGCTTAAGC CTACCTCTAG CTTACGGATT 
CCTGGCCAAA GTGTCGATAT AGAAGGTAAC CCTGTTGAGG TAATTACTAC TGGCCGCCAC 
GACCCGTGTG TGGGTATTCG AGCAACGCCA ATAGCTGAAG CAATGATGGC GTTAGTCATT 
CTCGATCACG CCCTTCGCAA CCGAGGTCAA AACGGTCACG TTCAATCGGG TGTGCCTATT 
ATTCCTGGGA GCATTCCCGG CCAAATAGGT AGCTAG

Protein sequence

MSGNTFGKLF TVTTFGESHG LALGAIIDGC PPGIELSEED LQLDLDRRKP GTSRYTTQRK 
EADQVKILSG VFEGKTTGTP IGLLIENTDQ RSKDYGKIKD QFRPAHADYT YMQKYGIRDY 
RGGGRSSARE TAMRVAAGAV AKKVLANLWG IKIRGYLSQL GPIKAELLDW NEVEQNPFFC 
PDKSKVPEME AYMQALNKEG NSVGAKITVV AENMIPGLGE PVFDRIDADL AHALMGINAV 
KGVEIGAGFA CVAQKGTEHR DEITPEGFKS NQAGGVLGGI STGQDLIASL ALKPTSSLRI 
PGQSVDIEGN PVEVITTGRH DPCVGIRATP IAEAMMALVI LDHALRNRGQ NGHVQSGVPI 
IPGSIPGQIG S