Gene Sbal223_3903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3903
Symbol
ID	7086666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	4629831
End bp	4631012
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	49%
IMG OID	643462780
Product	protein of unknown function DUF513 hemX
Protein accession	YP_002359801
Protein GI	217975050
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2959] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAACA ACAAGCACGA CGCAAAGAGC CCAGAATCAG AGGCTACCGC TATTATTGTG 
TCACCGGAAA CGACCGATGA TACGCCCGCA ACATCAGCGT CATCCACCGA ATCCCAAACA 
GCCAAAGCCA CCCCTTCAAC CGCGCCGAGC CAAACGCCAG CATCCAGTAG AAGCTCGTGG 
GCGATTCGCT TTGGGGTTTT ATTAGCGCTG GGGTTAACCG CTTGCACCCT TGGCGGCGGT 
TTTATGCTGT ACCAACAAAT GCAACAGCAA CTACTGGCGC AGGATGCGAA AAATATCGCC 
CTGCAGGACC AATTACAGCA AGCGCTGTTG CAGCCAAATC AACGTATTGG CCAGCTTGAA 
CAGCAACAAC TGAATGATGC TAAGACTTAT CAAGAATTAA CAAAATTGGC AGAAGACCAA 
AATCAACTGC AGGACAGGGT CAATAAACTG GCCCAGCGCA GCCCAACGCA TTGGATGGCC 
TCTGAAGCCG AATATCTAGT GAATATGGCG GGCCGTAAAC TTTGGTTAGA GAAAGATCCC 
CGCACCGCCA CCGATCTATT AAAGTCGGCG GATGAAACCA TCGCCGCCAT GAACAATCCG 
GCGTTACTGC CTATTCGTAA GGCATTAGCA AAAGACATCG CCGCCACGGC CAGCATTAAA 
ACCACAGATA TTGATGGCAA TGTATTGGCG CTCGATGCCT TAATTGAACA ACTCGATAAA 
CTGCCGCTGA ATCGCACCGA TGCAGAAACT GATGCCCCAG AAGATACGAC GATTACTGGG 
GATTTGAATG ATTGGCAGAG CAATCTGGGC AAAACGTGGA AAGCGTTAAC CCAAGACTTT 
ATTACCATAC GCCACAAAAC CGCCGATGCG CCCGCTTTAC TCGCACCAGA ACAGCAATGG 
TATCTGGTGG AGAACATTCG CCATAAACTG CTGCAATCGC AACTTGCGTT ATATCGCTAT 
GACAGAGCGG CTTATCACCA ATCATTGATG ATGGCGCGCA AATGGCTCCA AACCTATTTT 
GATACGCAAG ATCACAAGAC AGCTGAGGCC ATCGCCGAAA TCGATAAATT AGCGACCTTA 
GAACTTGATC CTATTACCCT GAAATCCTTT GCGGCTAAAC CTCTGTTATT ACAGCTGACT 
AGTTATGGCG AGCTGACCTC ATCAGAGGAT ACGCCACTAT GA

Protein sequence

MDNNKHDAKS PESEATAIIV SPETTDDTPA TSASSTESQT AKATPSTAPS QTPASSRSSW 
AIRFGVLLAL GLTACTLGGG FMLYQQMQQQ LLAQDAKNIA LQDQLQQALL QPNQRIGQLE 
QQQLNDAKTY QELTKLAEDQ NQLQDRVNKL AQRSPTHWMA SEAEYLVNMA GRKLWLEKDP 
RTATDLLKSA DETIAAMNNP ALLPIRKALA KDIAATASIK TTDIDGNVLA LDALIEQLDK 
LPLNRTDAET DAPEDTTITG DLNDWQSNLG KTWKALTQDF ITIRHKTADA PALLAPEQQW 
YLVENIRHKL LQSQLALYRY DRAAYHQSLM MARKWLQTYF DTQDHKTAEA IAEIDKLATL 
ELDPITLKSF AAKPLLLQLT SYGELTSSED TPL