Gene Shewana3_2005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_2005
Symbol
ID	4476369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	-
Start bp	2389743
End bp	2391692
Gene Length	1950 bp
Protein Length	649 aa
Translation table	11
GC content	49%
IMG OID	639726587
Product	WecB/TagA/CpsF family glycosyl transferase
Protein accession	YP_869642
Protein GI	117920450
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR00696] bacterial polymer biosynthesis proteins, WecB/TagA/CpsF family [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.148419
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACTC AGAACTCGAC TCAAGTACGC TGGTCTATTC GATTATTCGA TAGCGCCATT 
GCGATGCTGG CCTTATTGCT CTGCTCACCT TTTATTCTTG TGGTTTACCT TTACCGCAAG 
TCACAGGGAC AAAGTGTATT CGAACGTGTG TATGTGCATG GTGGCCGTAA TCAAATTGGT 
CTGTGGCAAT TTGCCTACCA AGGCGCAGGA TATCGTCTCC CCCAACTGTT TAATTTACTC 
AAAGGAGATA TCGGCCTATT AGGTGTTGAA GCCCAATTTG CCTTCACGCC TTTAGTCGAT 
TTACCTCAAG TTAATCGTAT TGATCGAGTG GGTATATTTT CCATCAGTGC TATGCAGCGC 
CGAATGGGGA TTGACTTTGA ATCCAGTGAG AAAAGCTTAA ACATCGCCTA TTCGAGCTTA 
AGCCGTTACT TCTTTGCGCT GCTAAGCGCT ATTTTGAATA GCCTTTTGAC CTCTGCTTCA 
CGCTCCCACA CTAACCAAGT CACGATTTTT GGCGTGACCA TGCGTAACCT CAGCATGACA 
GGCATGCTCG ACATGCTAGT ACAACAAGCA CAGCACCCAA AACACCACTT AACCCCATTT 
TCCTTTGTGA ATGCCGACTG TTTAAACAAA GCCTATTGCG ATCCCCAGTA CCATCAGATT 
TTGAATCAAT GTGAAGCCGT TTTTGCCGAT GGCATAGGGG TACGTATGGC TTGCCGCTGG 
CAAGGCGTGG ATCTCAGGGG CAATTTAAAT GGCACAGATA TGTTGCCACT CTTATGTGAG 
CGCCTGATTG CAGCCAATCT GTCTCTCTAT CTGCTGGGCG GCGCGCCAGA AGTCGCCCAC 
CAAGCCGCCG AACAGCTTCA GTGTCGTTTC CCACAATTAA AAATTGCAGG CACCCACCAT 
GGTTATTTCC ATGAGGCAGA TACCAAGCAA GTGATTAAAA AGATTAATCA ATCTGGCGCT 
GCCGTGCTGT TGGTGGCCAT GGGCGCCCCT AAACAAGAGC TATGGTTGAA TCAATATCAA 
GCAAAACTTA CTCCTGCGGT CGGTATTGGT GTGGGCGGAC TGTTCGACTT TTACTCCAAT 
CGTATTAGCC GCGCGCCACT TTGGTTAAGG CAAATTGGCA TGGAGTGGAT CTGGCGCTTA 
ATGCAAGAGC CCAAGAGAAT GTGGCGCCGC TACATTATCG GTAATCCCCT GTTTTTATAT 
CGGGTATTCA AAGAACTGCG TGCTAACGCC AGCCTTAATG CAAAGACTCA AGCTGACGTA 
CAACAAACAC CCGCTACGCC CCAGTTTCCT AACTTAAGTG ACTCAGGCTC ACTGAAACGC 
TGCAAACGCA TCCGCTTGCA TCTGCTATTG AACCGCATCG TTAAACGTTG CCTCGATATC 
TTAGTCGCGG CCATCGCCAT ACTGTTACTA TCGCCTCTAC TGTTGATCGT TGCACTGCTT 
ATTCGATTGG AATCCCCAGG CGCCGTGCTG TTTTGCCAGC AGCGCGTCGG CAAGTGGAAT 
CAACCTTTTA CCATGTGGAA ATTCCGCTCC ATGTATCAGG ACGCCGAAAC GCGACTGGCC 
AGCTTACAAC AGGCGAACGA AATGCAAGGC GGCGTCCTAT TTAAGATGAA ACAGGACCCC 
AGGATCACCC GTGTCGGTCA ATTTATCCGT AAAACCTCCA TCGATGAGCT GCCACAGCTA 
TGGAATGTAC TCAAGGGCGA GATGTCACTG GTTGGCCCGC GCCCCGCGCT ACCACGAGAA 
GTCGCGCAAT ACAGTCCAAG CGATCGCCGC CGCTTAGAAG TTAAACCCGG CATAACCTGC 
ATCTGGCAAG TATCGGGTCG CTCCGACATT CCCTTCGACC GTCAGGTTGA GTTGGATGTG 
GATTATATCT ACCAACAATC CTTAATGGCG GATCTGTCCT TGCTTATCAA GACCATACCC 
GCCGTGATTT TCAGCCGTGG TGCCTACTAA

Protein sequence

MNTQNSTQVR WSIRLFDSAI AMLALLLCSP FILVVYLYRK SQGQSVFERV YVHGGRNQIG 
LWQFAYQGAG YRLPQLFNLL KGDIGLLGVE AQFAFTPLVD LPQVNRIDRV GIFSISAMQR 
RMGIDFESSE KSLNIAYSSL SRYFFALLSA ILNSLLTSAS RSHTNQVTIF GVTMRNLSMT 
GMLDMLVQQA QHPKHHLTPF SFVNADCLNK AYCDPQYHQI LNQCEAVFAD GIGVRMACRW 
QGVDLRGNLN GTDMLPLLCE RLIAANLSLY LLGGAPEVAH QAAEQLQCRF PQLKIAGTHH 
GYFHEADTKQ VIKKINQSGA AVLLVAMGAP KQELWLNQYQ AKLTPAVGIG VGGLFDFYSN 
RISRAPLWLR QIGMEWIWRL MQEPKRMWRR YIIGNPLFLY RVFKELRANA SLNAKTQADV 
QQTPATPQFP NLSDSGSLKR CKRIRLHLLL NRIVKRCLDI LVAAIAILLL SPLLLIVALL 
IRLESPGAVL FCQQRVGKWN QPFTMWKFRS MYQDAETRLA SLQQANEMQG GVLFKMKQDP 
RITRVGQFIR KTSIDELPQL WNVLKGEMSL VGPRPALPRE VAQYSPSDRR RLEVKPGITC 
IWQVSGRSDI PFDRQVELDV DYIYQQSLMA DLSLLIKTIP AVIFSRGAY