Gene Shewmr7_2363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr7_2363
Symbol
ID	4256969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-7
Kingdom	Bacteria
Replicon accession	NC_008322
Strand	+
Start bp	2799621
End bp	2800781
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	47%
IMG OID	638123033
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_738407
Protein GI	114047857
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.445339
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.275941
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTTT ATGTGAAACA AGGCCAAGTC CCCCATAAGC GCCATATCGC ATTTGAGAAA 
GAAAACGGCG AGCTATACCG TGAGGAGCTG TTTTCAACCC ATGGTTTTTC CAATATTTAT 
TCCAATAAAT ATCACCACAA TATGCCGACT AAGGCATTGG AAGTGGCGCC CTACCGCCTC 
GGTCACGGTG CCCAATGGGA AGATTCATTA GTTCAAAATT ATAAATTGGA CTCTCGTACG 
GCCGATCGTG AAGGCAACTT CTTTAGCGCC CGCAATAAAA TCTTTTATAA CAATGATGTG 
GCTATTTATA CCGCAAAAGT GACTCAAGAC ACGTCGGAGT TTTACCGCAA TGCCTACGCC 
GATGAAGTGG TGTTTGTGCA CGAAGGTGAA GGCACACTCT ACAGTGAATA TGGCACCCTA 
GAGATCAAGA AATGGGACTA CTTAGTGATC CCACGCGGCA CCACACATCA GCTCAAATTC 
AACGATTACA GTAATGTGCG CTTATTTGTG ATTGAAGCCT TTTCAATGGT GGAAGTGCCA 
AAACATTTCC GTAATGAATA CGGTCAGTTA CTCGAGTCTG CTCCCTATTG TGAACGCGAT 
CTACGCACGC CCGTATTGCA AGATGCCGTG GTTGAACGTG GCGCCTTCCC GCTGGTGTGT 
AAATTTGGTG ATAAGTACCA ACTGACCACC TTAGAGTGGC ATCCCTTTGA CCTTGTGGGT 
TGGGACGGCT GTGTTTACCC CTGGGCATTT AACATCACCG AATACGCACC TAAAGTCGGC 
AAAATTCACT TACCGCCTTC AGACCACTTA GTGTTTACCG CCCACAACTT TGTGGTGTGT 
AACTTTGTGC CGCGTCCTTA TGACTTCCAC GAGCGTGCCA TTCCTGCGCC TTACTATCAC 
AACAATATTG ATAGTGATGA AGTGCTGTAC TACGTCGACG GTGACTTTAT GAGTCGTACA 
GGGATTGAAG CCGGTTACAT CACCCTACAT CAAAAAGGGG TAGCGCACGG CCCACAACCC 
GGCCGCACCG AAGCCTCGAT TGGCAAAAAA CAAACCTATG AATATGCAGT GATGGTGGAC 
ACCTTCGCCC CACTGAAATT AACCGAACAT GTGCAAAATT GCATGAGTAA AGACTACAAC 
CGCTCTTGGC TAGAAAACTA A

Protein sequence

MPFYVKQGQV PHKRHIAFEK ENGELYREEL FSTHGFSNIY SNKYHHNMPT KALEVAPYRL 
GHGAQWEDSL VQNYKLDSRT ADREGNFFSA RNKIFYNNDV AIYTAKVTQD TSEFYRNAYA 
DEVVFVHEGE GTLYSEYGTL EIKKWDYLVI PRGTTHQLKF NDYSNVRLFV IEAFSMVEVP 
KHFRNEYGQL LESAPYCERD LRTPVLQDAV VERGAFPLVC KFGDKYQLTT LEWHPFDLVG 
WDGCVYPWAF NITEYAPKVG KIHLPPSDHL VFTAHNFVVC NFVPRPYDFH ERAIPAPYYH 
NNIDSDEVLY YVDGDFMSRT GIEAGYITLH QKGVAHGPQP GRTEASIGKK QTYEYAVMVD 
TFAPLKLTEH VQNCMSKDYN RSWLEN