Gene Sama_1336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_1336
Symbol
ID	4603588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	1627401
End bp	1629698
Gene Length	2298 bp
Protein Length	765 aa
Translation table	11
GC content	58%
IMG OID	639780686
Product	DNA internalization-related competence protein ComEC/Rec2
Protein accession	YP_927213
Protein GI	119774473
COG category	[R] General function prediction only
COG ID	[COG2333] Predicted hydrolase (metallo-beta-lactamase superfamily)
TIGRFAM ID	[TIGR00360] ComEC/Rec2-related protein [TIGR00361] DNA internalization-related competence protein ComEC/Rec2

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.62013
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGAACC CATTTCTGCT GGGCTTTTGT GCCCTTGTCA TCTCATCGCT GCTCTGGCCA 
GTGCTGCCGC CCTGGCCGGC CTGCCTGCTT TTGCTTGTGG CATTGGGGTG TTACCGCAAG 
TTGCCTGTGC TCAGTGGAGC CCTGACTGCC GTGGCGTGGG TTGCTGTGTA CACCCATATG 
CTGTTCGATT ACAGCCACCT GCAACAAGCC GGTGATTCCT GGGTGCGTGG CGAGATAATA 
GCACCTGTGT CTGACAGCGG CGACTGGCAG AGTATAGATA TACGTCTTGT TAAACCAAAA 
TTAATCTGGC CTGTTGAGGG CAATATCAGG CTCAACTGGC GAACAACTGA CCAAATTCGT 
CCCGGGGAGC AGTGGGAATT TCGTCTTGCA CCCCGTTCCA TCACCTCGCC CCTCAACGAA 
GGCGCCTTCA ACGGTCAGCG TTACCTGCTA TCACGCCATG TGGGTATCAA GGCAAGAGTG 
CTGGAAGCAA GAAAAGTATC CGAGGCGTCA GGGCTTCGCG GGCTATTACT GGAGCACATT 
GGCCATGCCA TATCGGAGAA ACCCCGGCAG GCGCTGCTGT ACCCACTGCT GACGGGGGAA 
CAGCAGGGCA TAGATGCGCA GACCTGGCAG CGGCTCAGGC AAACCGGCAC CGGGCACCTG 
ATGGCCATCT CCGGGTTGCA TATGTCGGTG CTCGGAGCCT GGCTGTTGCT GCTGTGCCGC 
GCGCTGTTGA CCTCGTTTGC GCCGCGCCAG GACAGGCGTA ATTTGGTGAT TGCCATGATA 
GTCGCCACTG TGGGGTGTCT GCTCTATGGT CTGCTGGCGG GCATGGGCAT TCCTACCCGC 
CGGGCCTTTA TCATGCTGGC ATTGGTGGTG CTGCTGACCC TCAGTCGCCG TTTCGCCTCG 
CCCTGGGAGC GTTTGTTGTA CGCCCTTGCC GCTGTGTTGT TTCTCGATCC TTTGTCGCCA 
CTGTCTGCCG GATTTTGGCT GTCTTTTGGC GCCATCGTGA TTATGTTACT GCTATTGGAC 
CGGCCGCCCG CCCACCTTGA GGGTGTCCCC GGTCGATTAA AGCACTACCT GATGTCGCTG 
GTGACGCTGC AGTTGGCACT CAGTATCGGA CTGGGAGTAT TGCAGCTGGT GCTCTTTGGC 
GGTGTCAGTG TCCATAGCCT GTGGATTAAT CTGCTGATGG TGCCCTGGTT TTCGCTGGTG 
GCCATTCCCC TGGCGTTGGC AGGGCTTGTG TTTTTTGTTC TCTTGCTGCC TTTTGGGATA 
TTGGCCGACT GGGCGTTTAC TCCCGCCCTC ATGGCATTGA TACCGCTGGA TGGGCTTCTT 
ACGTTCAGTG ACCACTTACC CGGCGCCTGG ATAAGCGTGC CGGCACAGTT GATTGCGCCC 
CTGTGTTTTG CCATTGCAGG CGCTGTTTTA TTGTTTTTGC CTTTGGCGCG GGGTGTTAAG 
TGGGTGAGCG CCTCCTTACT GTTGCCGCTA CTGATAACTC TGAGTGTGAA AGGCGGGCCC 
CAATGGCAGA TGCATTTACT GGATGTAGGG CAGGGGCTGG CCGTCGTGGT TTTCAGCCGG 
GATCAAACAC TGGTGTACGA CACCGGATTG GCCTTTGGTG ACACCTTCTC CCATGGTGAG 
CGAACCCTGG TGCCATTTTT GCGGGCCAAG GGACGTAATC ACATCGATGT GTTGGTCATC 
AGCCATGAGG ATAAAGACCA TGCCGGTGGC GCCGCCGCGC TGGCCAGAGC AATGCCAGTC 
CACTTACTCA TCAGCGATAC CCGGGCTGCA AGGGATACAC TGGCGATGGA ACATGCGCCT 
TGCCGCCCTC AGGCATTCGC CCTTGGCAAT CTGTGGGTAG AGGTCCTGTC GCCCGCAGAC 
TCACCGGCTG GAAGAGTAGA CAATAATGCT TCCTGTGTGG TGACAGTGGG CGATGGTCAT 
TCGCGGCTGC TGTTGCCCGG CGACATTGAA GCCGAAGGGG AGACGCGGCT CCTTGGCAGT 
GGCGAGGCGT TGAACGCCAA TGTCTTAGTG GCACCCCACC ATGGCAGCCT GACGTCATCG 
ACTCCGGCCT TTGTCGCGGG CGTAGCACCG GCCATCACCC TCTTTGCTGC CGGCGCCAAC 
AACAGATACG GTTTTCCTAA AGACGCCGTG GTGCAGCGAT ACCTGGCCCA GGGCAGTCAA 
ACGTTTACTG CGGCGGATAC CGGCCAGATA AGCCTGTACC TTGATGATGA AATCACAGTG 
AAAACCTATC GGGGTTCGCT GGCCCCTTTT TGGTATAACC GGGTCTTTGG AGTTGGTGGC 
AGGCCGATTA CAGAGTAG

Protein sequence

MKNPFLLGFC ALVISSLLWP VLPPWPACLL LLVALGCYRK LPVLSGALTA VAWVAVYTHM 
LFDYSHLQQA GDSWVRGEII APVSDSGDWQ SIDIRLVKPK LIWPVEGNIR LNWRTTDQIR 
PGEQWEFRLA PRSITSPLNE GAFNGQRYLL SRHVGIKARV LEARKVSEAS GLRGLLLEHI 
GHAISEKPRQ ALLYPLLTGE QQGIDAQTWQ RLRQTGTGHL MAISGLHMSV LGAWLLLLCR 
ALLTSFAPRQ DRRNLVIAMI VATVGCLLYG LLAGMGIPTR RAFIMLALVV LLTLSRRFAS 
PWERLLYALA AVLFLDPLSP LSAGFWLSFG AIVIMLLLLD RPPAHLEGVP GRLKHYLMSL 
VTLQLALSIG LGVLQLVLFG GVSVHSLWIN LLMVPWFSLV AIPLALAGLV FFVLLLPFGI 
LADWAFTPAL MALIPLDGLL TFSDHLPGAW ISVPAQLIAP LCFAIAGAVL LFLPLARGVK 
WVSASLLLPL LITLSVKGGP QWQMHLLDVG QGLAVVVFSR DQTLVYDTGL AFGDTFSHGE 
RTLVPFLRAK GRNHIDVLVI SHEDKDHAGG AAALARAMPV HLLISDTRAA RDTLAMEHAP 
CRPQAFALGN LWVEVLSPAD SPAGRVDNNA SCVVTVGDGH SRLLLPGDIE AEGETRLLGS 
GEALNANVLV APHHGSLTSS TPAFVAGVAP AITLFAAGAN NRYGFPKDAV VQRYLAQGSQ 
TFTAADTGQI SLYLDDEITV KTYRGSLAPF WYNRVFGVGG RPITE