Gene Sama_3384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_3384
Symbol
ID	4605631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	4010493
End bp	4012151
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	58%
IMG OID	639782804
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_929256
Protein GI	119776516
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis [COG4261] Predicted acyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTTG CCATAATCAT CCCCAATTAC AATCATACCC ATGCCATCGA GCGCACTCTG 
GAAACGCTGG AGCCTTTGGG GCTGCCGGTG TTTCTGGTCA ACGATGGCAG CAACGAGGCT 
ACCTGTCATC TACTGATGGT CCTCGACGCC AAATACCCCT GGGTCACCCT GCTGCACCAC 
CCCTTTAACC GGGGTAAGGG CGCTGCGGTA ATGACCGGCC TGCGTGCAGC CTACAAAGCG 
GGCTTCAGCC ATGCGCTGCA GGTGGATGCC GATGGTCAGC ACACCCTCGA TGACATTCCA 
ACACTGTTAA GTGCCGCCAA CGAGCACCCC GAGGCGGTGA TTTCAGGTCG TCCCCAGTAC 
GATGACTCTG TGCCCAAGGG TCGCCTCTAT GGCCGCTATA TCACCCATTT CTGGGTGTGG 
GTCGAGACCT TGAGTTTTGA TATTCAGGAC AGCATGTGCG GCTTTCGGGT CTATCCGCTG 
AAGGCCACCG AGGCACTGTT TTTAAGTGAA CAGCTTGGCG AGCGCATGGA CTTCGATATC 
GAAGTGCTGG TCAAGCTTTA CTGGCGCGGC GTTGACGTGA TTCACGTGCC CACGGCGGTG 
ATTTACCCCG AAGACGGTGT CAGCCATTTT CAGGGCTTTG CCGACAACGT GCGCATCAGC 
GCCCTGCACA CCAGACTCTT TTTCGGCATG CTCAAACGCC TGCCAAGCCT GCTTGGCCGG 
GGCAGAAAGC AAACCCACTG GTCGTCCATC AGCGAGCGTG GCAGCTATTG GGGCATCAAG 
CTTTTGGCCG AGAGCTACCG CTTCGGAGGC CATTGGCTGT GCCGCGCCAT CATGTACCCC 
GTGATTGCCT ATTTCTTTAT GACCGGCGGC GCTGCCCGCA AGGCCTCGAT TGAGTTTCTG 
GAGCGGGTGC AGGCACTGGA GCCAAATCAT CCCCAGCTGC AGCCAAGGGT CAGTTGGCGC 
CACAGCCTTA AGCACTTCCT CGCCTTTGGC AATGCCGCAC TCGACCGAAT CGACGCCTGG 
TGCGACCGCA TCAAACTGAG CGAAGTCGAT TTCCCCGAGC GGGCACTGCT GGCGGATATG 
CTCACCCGAG GCCAGGGCGG CGTGCTGCTG GTATCCCACC TTGGTAACCT CGAGCTTTGC 
CGCGCCATTT CCATCCACCA GCGCAAGGTA AAAGTGAACG TGATGGTGAT GACCGCCAAC 
GCCGAAAACT TCAACAAGGT GCTGAAGCAG CTAAACCCAG ACAGCGACCT AAACCTCATT 
CATATCAATG AGCTGGACCC ATCTACCTCT ATCATGCTGG CAGACAAAAT TGCCGCAGGT 
GAACTGGTGG TAATAGCCGG GGATCGCACC GCCAGTGGCA ATGCAGGCCG GGTTGTCGAA 
GTGCCCTTCC TTGGCGAAAC GGCGCCTTTC CCACAAGGGC CCTTTATTCT GGCAAGCCTG 
CTCGATTGCC CGGTATTTCT GATGTTTTGC CTGCGGGAGC AGGGCCGCTA CCGGGTGCAT 
GTGGAGCCCT TTGCCGACAC CCTCAAGGGC CCCAGAGCCG GCAGAAGTGA ACGTATTCAA 
AACGCGGTCG AACGCTATGC TGAAAGGCTT GAGCACTACG CCCGCAAAGA GCCACTGCAG 
TGGTTCAACT TTTTCGATTT TTGGCGCCGC GGCCAATAA

Protein sequence

MRVAIIIPNY NHTHAIERTL ETLEPLGLPV FLVNDGSNEA TCHLLMVLDA KYPWVTLLHH 
PFNRGKGAAV MTGLRAAYKA GFSHALQVDA DGQHTLDDIP TLLSAANEHP EAVISGRPQY 
DDSVPKGRLY GRYITHFWVW VETLSFDIQD SMCGFRVYPL KATEALFLSE QLGERMDFDI 
EVLVKLYWRG VDVIHVPTAV IYPEDGVSHF QGFADNVRIS ALHTRLFFGM LKRLPSLLGR 
GRKQTHWSSI SERGSYWGIK LLAESYRFGG HWLCRAIMYP VIAYFFMTGG AARKASIEFL 
ERVQALEPNH PQLQPRVSWR HSLKHFLAFG NAALDRIDAW CDRIKLSEVD FPERALLADM 
LTRGQGGVLL VSHLGNLELC RAISIHQRKV KVNVMVMTAN AENFNKVLKQ LNPDSDLNLI 
HINELDPSTS IMLADKIAAG ELVVIAGDRT ASGNAGRVVE VPFLGETAPF PQGPFILASL 
LDCPVFLMFC LREQGRYRVH VEPFADTLKG PRAGRSERIQ NAVERYAERL EHYARKEPLQ 
WFNFFDFWRR GQ