Gene Suden_2059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Suden_2059
Symbol
ID	3762665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfurimonas denitrificans DSM 1251
Kingdom	Bacteria
Replicon accession	NC_007575
Strand	-
Start bp	2149905
End bp	2151053
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	39%
IMG OID
Product	diheme cytochrome c SoxD
Protein accession	YP_394568
Protein GI	78778253
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000000173988
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAAAT TAAATAATAA ATTAATTATT TTAGGGGTTT CTGTGGTTGC AAGCAGTGCT 
CTGTTTTTCA CAGGTTGTTT AGGTTCAAAT GCTTCTGCTG GAAACTCATC AGCAAAAGTA 
AGCTCAGCAG CAAATGGTAT GTATAATCCA ACAAAAGACG CTCTTGATGG TGGTGTTACA 
TACAAAAGAG AAAATGGTAT GTATGCTGCG TATGCTGTTA ATGACCAAGC TACAACTGGT 
GTAAACTTTG GTAGAACACC AACTCCAAAT GAGCTAAAAG CATGGGATAC AGATATTATG 
CCAGATGGTA CGGGCTTACC AGTTGGTAGC GGTACTGTTG ATGATGGTGA AGCACTTTAT 
GATAAAGATT GTGCTGTTTG TCATGGTGAG TTTGGTGCAG GCGGTAAAGG TTACCCAACT 
CTAACGGGTG GTTCTTTAAA ATCATTATCA AACCAAAGAA CTTGCCCTGG CAAAGATGCT 
CCAAATAGAA CAATTGGTTC ATATTGGCCA CAAGCTAGTA CGTTGATTTG GTATATTCGT 
GATGCAATGC CATATGCAAA CCCAAAAAGT TATACACCAG ATCAGATGTA TGCTATGACG 
GCTTACTTGC TAAAAGAAAA TGGTGTTAAA ATAGATGGTG AAGATATTGA AGAGTTAAAT 
CAAGATAACT TCAAAAAGAT AGTTATGCCA AATCGTGATG GATTTTATCC AAATATTGAT 
GGACCAAATG GTGTAGAAAA TGTTAAAGCA TTCTACAAAG ATCCTAAGAA CTTTGGTGCA 
GTTGGAGTAC GTTGTATGAC TAACTGTGGA AAAGAGAGTG TAGCAACAAT AGGAAACGAG 
ATAACTGCGG TAGTACCTGC TTACTCTACT CTAAGAGATC TTCCACCAGA AAGCGCAAGT 
GGACCAGTGT CAGAGGCTCA AAAGATATAT GAAAAATCAT GTGCAGTTTG CCACAAAACT 
GACACTATGG GTGCACCTGC GCTTGGAGAC AAGAATGCTT GGGCAACCGT ATTAGAGCAA 
GGTATAAACA TGGTAAATAA CAATGCAATC AATGGTATTG GCGGTATGCC TCCAAAGGGT 
GGCGCTATGG ATTTAAGTGA CGACCAAGTC AAAGATGTTG TTAAATTTAT GGTAGAATCT 
AGTAAGTAG

Protein sequence

MIKLNNKLII LGVSVVASSA LFFTGCLGSN ASAGNSSAKV SSAANGMYNP TKDALDGGVT 
YKRENGMYAA YAVNDQATTG VNFGRTPTPN ELKAWDTDIM PDGTGLPVGS GTVDDGEALY 
DKDCAVCHGE FGAGGKGYPT LTGGSLKSLS NQRTCPGKDA PNRTIGSYWP QASTLIWYIR 
DAMPYANPKS YTPDQMYAMT AYLLKENGVK IDGEDIEELN QDNFKKIVMP NRDGFYPNID 
GPNGVENVKA FYKDPKNFGA VGVRCMTNCG KESVATIGNE ITAVVPAYST LRDLPPESAS 
GPVSEAQKIY EKSCAVCHKT DTMGAPALGD KNAWATVLEQ GINMVNNNAI NGIGGMPPKG 
GAMDLSDDQV KDVVKFMVES SK