Gene Shewmr4_2604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2604
Symbol
ID	4253175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	3099761
End bp	3100747
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	51%
IMG OID	638119239
Product	fumarylacetoacetate (FAA) hydrolase
Protein accession	YP_734732
Protein GI	113970939
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000203014
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000000504618
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACTTG CCAGTTATAA CAATGGTCGC CGTGATGGCC AGCTGATGTT AGTGAGCCGC 
GATCTTACTC AAACGGTTGC CGTACCCGCG ATTGCCCATA CGATGCAACA ATTACTCGAT 
GGTTGGGATC TGCTCAAGCC ACAATTGCAA GAATTGTATG ATGCGCTGAA CGAAGGCAAA 
TTACCAAACG CACAAGCCTT CGATGAAGCC AAATGTTTAT CACCTTTGCC ACGTGCGTAC 
CAGTGGGCCG ATGGTAGCGC CTATGTTAAC CATGTGGAAT TAGTCCGTAA GGCGCGCGGC 
GCTGAAATGC CAGAAACCTT CTGGACCGAT CCGCTATTTT ACCAAGGCGG CTCTGACAGC 
TTTATCGCGC CAAAGGCGGA TATCTCGCTG GCGAGCGAAG ACTGGGGTAT CGATTTCGAA 
TCGGAAATCG CCGTGATCAC CGATGATGTG CCTATGGGCG TGAGTGTTGA AAATGCTACG 
TCACACATTA AGCTGTTGAT GTTAGTGAAC GACGTATCTC TGCGTAACCT GATCCCCGCA 
GAGCTGGCGA AAGGTTTCGG TTTCTTCCAA TCCAAACCTT CGAGCAGCTT CTCACCTGTC 
GCCATCACGC CAGATGAATT AGGCCACCGC TGGGAAGATT CAAAGGTGCA TTTACCGCTT 
ATCACCCATT TAAATGGCAA ACTATTCGGT CGCCCGAATG CGGGCGTGGA TATGACCTTT 
AACTTCAGTC AGTTAGTTTC TCATGTTGCT AAAACCCGTC CATTAGGCGC GGGCGCGATT 
ATCGGTTCGG GTACGATTTC TAACTATGAC CGCAGTGCCG GCTCAAGCTG TTTGGCCGAG 
AAACGTATGC TCGAAGTGAT CGCCGACGGC AAAGCCAGCA CGCCGTTTAT GCGTTTTGGC 
GACACTGTGC GCATCGAAAT GCTCGATGAT AACGGCGCCT CTATTTTTGG CTCTATCGAT 
CAAAAAGTGG TTGAGTACAA GGCGTAA

Protein sequence

MKLASYNNGR RDGQLMLVSR DLTQTVAVPA IAHTMQQLLD GWDLLKPQLQ ELYDALNEGK 
LPNAQAFDEA KCLSPLPRAY QWADGSAYVN HVELVRKARG AEMPETFWTD PLFYQGGSDS 
FIAPKADISL ASEDWGIDFE SEIAVITDDV PMGVSVENAT SHIKLLMLVN DVSLRNLIPA 
ELAKGFGFFQ SKPSSSFSPV AITPDELGHR WEDSKVHLPL ITHLNGKLFG RPNAGVDMTF 
NFSQLVSHVA KTRPLGAGAI IGSGTISNYD RSAGSSCLAE KRMLEVIADG KASTPFMRFG 
DTVRIEMLDD NGASIFGSID QKVVEYKA