Gene Paes_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1994
Symbol
ID	6459867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	2192090
End bp	2193241
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	53%
IMG OID	642725979
Product	glycosyl transferase family 2
Protein accession	YP_002016653
Protein GI	194334793
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.713499
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGATCT ATCAACTCTC AATTCTGTTC TGCCTTCTGG TTTTTTTTGT GATTGTTCTC 
CTGAACCTGA AGGATTTCAA AAAGCTACCC TCGCGCGCTA CCAGCGTATC TCCTCTGGTT 
TCGGTGCTCG TTCCCGCGCG TAATGAAGAC AACACCATAG CCCGGTGCAT CGAGTCGCTC 
CTGATTCAGG ATTACGGTAA TTTCGAAATC ATTGTGCTCA ATGACGGCTC TACCGACCGT 
ACTGCTGAGG TGCTGCAGTC GATAGTCAGC TCAGTTCAAG GGGCCGCATT GCGTGTGATT 
GACGGAACGA CGCTGCCTGA TGGCTGGCAC GGCAAGGCCT GGGCCTGTCA GCAGCTCGGT 
GCAGAAGCCA GGGGAGAACT GCTGCTGTTT ACCGATGCCG ATACCGTTCA TGCTCCCGAC 
AGTGTTCGGC GGGCCGTTGC GGCTCTGGAC GAGAGCCGGG CCGATATGCT CTCTCTGACA 
CCCTATCAGG AGACGAAGTC GTTCTGGGAG CGCCTGATTA TTCCTGTGAT GTACGTTATC 
GTGTTCTGCT ACCTTCCTTT GCGCATGGTC CGGGAACATG CTTCCGAAGC GTTCTGCTTC 
GCCAACGGTC AGTTTATCAT GATGCAGAGA AAGATGTACG ATCTCATCAA CGGCCACAGC 
GCAGTCAGAC GCAATATTGT CGAGGATGTC TGGTTGTGCA AAGCGGTGAA GAGAGCCGGA 
GGCAGCGTTG CGGTCTACAA TGGTACCGAC ACGGTGCGTT GCAGAATGTA TCGGACTCTT 
TCGGAGATAT GGCAGGGGTT TTCCAAAAAC CTCTTTGCAG GGCTTGGATA CAACACTATC 
GGACTCTTTA GCCTGATTGT CATGACGGCA TTATTCTACA TCGTACCCTA TATTTTTGTT 
TTTCGGGCAC TGCTTCTGCA GGATTATTCG TTCTTCGTTT TCTGGCTGCC TTGCCTGCAG 
ATTGCTCTTG CCATGCTCAT GCGGCTCTTC ATTGCAGTAC GATTCCGTCA GCCGCTCAGC 
GGTGCACTGC TGCACGGTTT GTCGCAGCTG ATGCTCATCG CTCTGGCCGC AAATTCGTTT 
TACCTCGTCA GATTCGGCGG CGGAGCGCGA TGGAAGGGGC GCCAATATGA TTTTTCAGAC 
CATCAATCCT GA

Protein sequence

MMIYQLSILF CLLVFFVIVL LNLKDFKKLP SRATSVSPLV SVLVPARNED NTIARCIESL 
LIQDYGNFEI IVLNDGSTDR TAEVLQSIVS SVQGAALRVI DGTTLPDGWH GKAWACQQLG 
AEARGELLLF TDADTVHAPD SVRRAVAALD ESRADMLSLT PYQETKSFWE RLIIPVMYVI 
VFCYLPLRMV REHASEAFCF ANGQFIMMQR KMYDLINGHS AVRRNIVEDV WLCKAVKRAG 
GSVAVYNGTD TVRCRMYRTL SEIWQGFSKN LFAGLGYNTI GLFSLIVMTA LFYIVPYIFV 
FRALLLQDYS FFVFWLPCLQ IALAMLMRLF IAVRFRQPLS GALLHGLSQL MLIALAANSF 
YLVRFGGGAR WKGRQYDFSD HQS