Gene Sama_1568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_1568
Symbol
ID	4603820
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	-
Start bp	1912255
End bp	1913292
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	52%
IMG OID	639780924
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_927445
Protein GI	119774705
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGCG AAACCAATCC ACTGGGCCTG CTCGGCATCG AATTTACCGA GTTTGCCACC 
CCAGATAACG ACTTCATGCA CAAGGTTTTT CTGGACTTTG GCTTTTCCAT GCTGAAAAAG 
CACAAGGAAA AAGACATCTA CTACTACCAG CAAAACGACA TCAACTTTTT GATGAACCGT 
GACCGCGCCG GTTTCTCGGC CGGTTTTGCC AAGTCTCACG GCCCGGCCAT CACCTCCATG 
GGCTGGCGCG TGGAAGATGC CGAATATGCC TACAAGCACG CGGTTGAACG TGGCGCCAAG 
GCCGCCCCGG ATGACGTGAA AGACCTGCCC TACCCAGCCA TTTACGGCAT TGGTGACAGC 
CTGATTTACT TCATCGACCG TTTCGGTGAT GACAACATCT ACGCCACCGA TTTTGTTGAT 
CTGGATGAGC CTGTGATTGT GCAGGAAAAA GGCTTTATGG AAGTCGACCA TCTGACCAAC 
AACGTCTACA AGGGCACCAT GGAACAGTGG TCAAACTTCT ATAAAGACGT TTTTGGCTTT 
ACCGAAGTGC GCTACTTCGA CATCAAGGGC TCCCAGACTG CACTGATTTC TTACGCGCTG 
CGTTCACCGG ATGGCAGCTT CTGTATCCCT ATCAACGAAG GTAAAGGCGA CGATCGTAAC 
CAGATTGACG AATACCTGCG TGAATACAAT GGCCCGGGCG TTCAGCACCT GGCGTTCCGC 
AGCCGTGACA TAGTTGCCTC GCTGGATGCA ATGGAAGGCT CGTCCATTGC GACACTGGAC 
ATTATCCCTG AATACTACGA CACCATCTTC GAAAAACTGC CCCAGGTGAC CGAAGACCGT 
GAGCGCATCA AGCATCACCA AATTCTGGTG GATGGCGATG AAAACGGCTA CCTGCTGCAG 
ATTTTCACCA AGAACCTGTT TGGTCCTATC TTTATCGAAA TCATCCAGCG TAAGAACAAC 
CTGGGTTTCG GTGAAGGTAA CTTCAAGGCG CTGTTTGAAT CTATCGAGCG CGATCAGGTC 
CGCCGCGGCG TGCTTTAA

Protein sequence

MASETNPLGL LGIEFTEFAT PDNDFMHKVF LDFGFSMLKK HKEKDIYYYQ QNDINFLMNR 
DRAGFSAGFA KSHGPAITSM GWRVEDAEYA YKHAVERGAK AAPDDVKDLP YPAIYGIGDS 
LIYFIDRFGD DNIYATDFVD LDEPVIVQEK GFMEVDHLTN NVYKGTMEQW SNFYKDVFGF 
TEVRYFDIKG SQTALISYAL RSPDGSFCIP INEGKGDDRN QIDEYLREYN GPGVQHLAFR 
SRDIVASLDA MEGSSIATLD IIPEYYDTIF EKLPQVTEDR ERIKHHQILV DGDENGYLLQ 
IFTKNLFGPI FIEIIQRKNN LGFGEGNFKA LFESIERDQV RRGVL