Gene Shewmr4_3546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_3546
Symbol
ID	4254111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	4236766
End bp	4237806
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	50%
IMG OID	638120183
Product	hypothetical protein
Protein accession	YP_735668
Protein GI	113971875
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID	[TIGR00661] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.279975
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAATAC TCTACGGAGT TCAAGGCACA GGGAATGGCC ACCTAAGTCG TGCTCGAGTG 
ATGGCAAAAG CCTTAATTGA GCACAATATT CAAGTCGACT TTTTGTTTTC GGGGCGCAAG 
CCTGAGCATT TTTTCGATAT GGAGTGTTTT GGGGAGTATC GCGTACAGGC GGGAATGACC 
TTTGCGACTC ACTCAGGACG AGTGAATGTA TCGCAAACGG TGAGACAGAA TTGCTCCTTG 
TCATTGCTTA AGGATATCCA AGCATTAGAT TTGAGTTGCT ATGACCTAGT GCTGAATGAT 
TTTGAACCCG TATCCGCATG GGCGGCGAGG CGCCAAGGCG TCCCTTCCAT TGGCATAAGT 
CATCAAGCGG CCTTGACTCA CCCAGTGCCT AAGTTGGGGA GCACTTGGTT TAATGAGTTG 
CTACTCAACT ATTTTGCGCC AGTGGATGTG GCACTGGGTT GCCATTGGCA TCATTTTGGT 
TTTCCGATCC TACCTCCCTT TGTCGAAGTC GATGCCAGTC CTATTGAACA TACCCATCAA 
ATTTTGGTGT ATTTACCCTT CGAAGAGGCG GATGCGATCG CCGAATTTTT TAAGCCTTTT 
ACGGATTATC AGTTTTTGGT GTATCACGCT AAGCAGCCGA CAGCACCGCT CGCCGACCAT 
ATTCAATGGC ATGGTTTTAA TCGTGACGGA TTTAAACAGC ACTTAGCGAG CTGCGGTGGA 
GTGATTGGTA ATGCCGGATT TGAGTTGGCG AGCGAGGCGC TGACCTTAGG TAAGAAGTTG 
TTGGTCAAGC CGCTGATTGG TCAATTCGAG CAGTTGTCGA ACGTGGCAGC GCTGCAATTA 
TTGGGCGCGG GTGACAGTAT GATGAGTCTA GACATGGGCG TGGTCAAACG TTGGCTCAAG 
GCAGCATCGC CAAGTCCCAT CGCCTATCCA CAGGTGGGTG ATGCCTTAGT GAAATGGATT 
TGCAGCGGTC AGTGGCAACA TACCGCGCCA TTGTGTGATG ACCTTTGGAG CCAAGTGAAG 
CTACCCGACA CCTGGCGCTA A

Protein sequence

MRILYGVQGT GNGHLSRARV MAKALIEHNI QVDFLFSGRK PEHFFDMECF GEYRVQAGMT 
FATHSGRVNV SQTVRQNCSL SLLKDIQALD LSCYDLVLND FEPVSAWAAR RQGVPSIGIS 
HQAALTHPVP KLGSTWFNEL LLNYFAPVDV ALGCHWHHFG FPILPPFVEV DASPIEHTHQ 
ILVYLPFEEA DAIAEFFKPF TDYQFLVYHA KQPTAPLADH IQWHGFNRDG FKQHLASCGG 
VIGNAGFELA SEALTLGKKL LVKPLIGQFE QLSNVAALQL LGAGDSMMSL DMGVVKRWLK 
AASPSPIAYP QVGDALVKWI CSGQWQHTAP LCDDLWSQVK LPDTWR