Gene Sama_0454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_0454
Symbol
ID	4602709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	559471
End bp	561156
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	54%
IMG OID	639779790
Product	MSHA biogenesis protein MshL
Protein accession	YP_926334
Protein GI	119773594
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1450] Type II secretory pathway, component PulD
TIGRFAM ID	[TIGR02519] pilus (MSHA type) biogenesis protein MshL

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTT CTGGTATCAA ATACCTTACC CCTCTGCTGT CGCTGTGCCT GATAGCATGC 
CAAACCACTG ACAGGCCCAA CCCTCAGGCG TCCAAAGAGG CGCTCAGGGA GGTTGTGGCT 
CAACAAAATG CACAAGCTCA GCCACCGGCC AAATTGCCCG ATTCAGTGTC CCGCGAATTG 
GCCGGCAGTA ACACAGTATT TGCGCCAACG CTGCCACCGG AGCGCCGTTT CGATGTGGCT 
GCCAATGCGG TGGATGCCAG AGTGTTTTTT CCGAGTTTGG TCAAGGGAAC GCCTTTCAGC 
GTGGCCGTAC ACCCCGATGT GCAGGGACGG ATTTCTCTGT CGCTCAAAGG CGTGACCCTG 
AGTGAGGCCT TGCAGGTGAT TGAAGACCTG TACGGCTATG AAGTCAGCCA TGAGGGCAAG 
GTGCTAAAGG TATTCCCATC GGGCATGCGA ACCGAAACGT TCCCGGTGAA CTACCTCTAT 
ATGGAACGCA TGGGGGTGTC TCTAACGTCT GTGACGTCCG GCCGTATTTC CGACAACAAT 
AACAACAATA ACAACGGCAA TAACAACAAC GGCAGCAATG GTAATAACGC TTTTGATAAC 
GGCGGGGCCA ACAATAACGG TGTCAACGGC AACAATACCA ATGGTAACAA TACCAACGGC 
ACCTTTATCC AGTCCCGCAA TAAAACAGAC TTCTGGGGTG AACTGAAAGA AACCCTTGAG 
TCCTTGATTG GTGGCACCAG TAACAACCGC AGTGTGGTGG TCACACCCCA GGCCGGCTTG 
GTGACTGTGC GTGCGCTGCC GGGTGAGCTG CGTCAGGTGA GGGAGTTTTT GGCCACCGCC 
GAAACCCATC TGCAGCGTCA GGTGATTTTG GAGGCCAAGG TGCTTGAGGT GACCCTGTCT 
GATGGTTATC AGCAGGGTAT CCAATGGAAC AAGATTGCCG GCAGTGCACT GGCCGATGGC 
AACACCAAAA TTAATTTCGC CACTTCAGCA GGCAATGAGT TCGGCAATCA AATTTCCAGT 
GCCTTGGGCG GCGTAACCTC GTTGTCCATC ATAGGTTCAG ACTTCGACGC CATGATAAAT 
CTCCTCGATA CTCAGGGGGA TGTGGATGTG TTGTCGAGCC CCCGTGTCAC CGCCTCCAAC 
AACCAAAAGG CGGTGATCAA GGTGGGCAAG GATGAATACT TTGTCACTGA TGTGTCATCC 
ACCACAGTGG CGGGCACCAC ACCTGTGACC AGCCCCGAAG TCGAGCTGAC ACCCTTTTTC 
TCCGGTATCG CACTGGATGT TACCCCACAG ATTGACGGCC AGGGCAATGT GCTGCTGCAT 
GTGCATCCCT CGGTTATCGA TGTGAAAGAA CAAACCAAGA CCATCAAAAT CAGCAACAGC 
GATCTGGAGC TGCCCCTGGC CCAGAGTGAG ATCCGCGAAT CGGATACCGT GATTAAAGCC 
ATGTCGGGGG ATGTGGTGGT GATTGGGGGT CTGATGAAGA GTGAGAGCTT GGAGCTGGTG 
TCCAAGGTAC CTCTGCTTGG GGATATTCCG TTTCTGGGTG AAGCTTTTAC CAACCGCAGT 
CAGTCTGTTC GTAAAACGGA GCTGGTGATA CTGCTCAAAC CAACCGTGGT CGTAAGCGGC 
ACCTGGCAGA AAGAGCTGGA GCGGTCAAAG GCCTTGTTGG ACCGTTGGTA TCCCGAGGGC 
GAATAA

Protein sequence

MAISGIKYLT PLLSLCLIAC QTTDRPNPQA SKEALREVVA QQNAQAQPPA KLPDSVSREL 
AGSNTVFAPT LPPERRFDVA ANAVDARVFF PSLVKGTPFS VAVHPDVQGR ISLSLKGVTL 
SEALQVIEDL YGYEVSHEGK VLKVFPSGMR TETFPVNYLY MERMGVSLTS VTSGRISDNN 
NNNNNGNNNN GSNGNNAFDN GGANNNGVNG NNTNGNNTNG TFIQSRNKTD FWGELKETLE 
SLIGGTSNNR SVVVTPQAGL VTVRALPGEL RQVREFLATA ETHLQRQVIL EAKVLEVTLS 
DGYQQGIQWN KIAGSALADG NTKINFATSA GNEFGNQISS ALGGVTSLSI IGSDFDAMIN 
LLDTQGDVDV LSSPRVTASN NQKAVIKVGK DEYFVTDVSS TTVAGTTPVT SPEVELTPFF 
SGIALDVTPQ IDGQGNVLLH VHPSVIDVKE QTKTIKISNS DLELPLAQSE IRESDTVIKA 
MSGDVVVIGG LMKSESLELV SKVPLLGDIP FLGEAFTNRS QSVRKTELVI LLKPTVVVSG 
TWQKELERSK ALLDRWYPEG E