Gene Suden_2053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Suden_2053
Symbol
ID	3763039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfurimonas denitrificans DSM 1251
Kingdom	Bacteria
Replicon accession	NC_007575
Strand	-
Start bp	2138986
End bp	2140188
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	37%
IMG OID
Product	aromatic hydrocarbon degradation protein
Protein accession	YP_394562
Protein GI	78778247
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00000452049
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAA CAATTAAACT CGCAGTAGTA GCTGCATTAG CTTTGGGTAC AACTTCTGCA 
TTCGCAACAA ATGGTGACAC TATGATAGGT GTTGGTGCAA AAGCTATCGG TATGGGTGGT 
GTTGGTATTG GTGTAAGCCA TGGTGCAGAA TCAGCATTAA CAAACCCTGC GATGATTACT 
AATGTAGAGG GAACTGAAAT TTCTTTCGGT GGTACTATAT TTATGCCAGA TGTAAAAACT 
AATATGGGAG ATGGATCAGG TTTTCATAAT AGTGATGCTG ATCTTTCAGT AATTCCTTCA 
GTTGCAATTG CCCAAAAAGT ATCTAATAAT TTTTACTGGG GTATTGGTAT GTACGGGGTA 
GCTGGTATGG GAACGGATTA TCGTGATGCT ACTGGCGGTA TGGCTAATAT GAATATGGTA 
ACAAATTTAC AGTTAATGCA ATTTGTGGTT CCATTAGCAT ATAAAGCAAA CGGATTTAGT 
CTTGGTATAG CTCCAATACT TCAATACGGT TCATTAGACA TTAATTATGA TATGAGTGCA 
ATGTATATGG CTGCGCCTGG TACGAATATG TCAACTACAA GAGGCGTTGC ACAAGATTTT 
GGTCTTGGTT ATAATGTTGG TGTAGCATAC GAAACAGCAG GCTTAACAGT TGGTGCTTCG 
TATAAATCAA AAATTGATAT GGAATACAAA GGACAAATTA GTAGAGCAAT GAAAGATTTC 
ACTGGATTTT TAGGTTCTGA TAGTTTAGAA CAACCAGCAG AAATTGGAGT TGGTGCATCA 
TATAAGGTAA GCGGTAACAC TTTTGCAATA GATTATAAAC AAATTAAATG GTCTGATGCA 
AAAGGGTATA AAGATTTTGC ATGGGATAAT CAAAATGTAA TTATGGTTGG TTATCAATAT 
GCTCAAGATA ATTGGGCACT ACGTGCAGGT TATAATCATG CAAAAAGCCC AATAAAAGAT 
CAAGGAATGG CAGGTTCATT ATCAAATGTA TTTAACCTTC TTGGTTTCCC AGCAATAGTT 
GAGAGTCATT ATACTGTTGG TGCAAGCTAT GGTTTCAGCA AAATGACATC ACTTGATTTA 
GCGTATGTTT ACTCACCAGA GGCAAGTGAG AATTATGCAT ATAGCTTAGG TGGTCCAGCA 
ACTACTATTG AAACAAAACA TAGTCAATCA GCTGTTACTG CACAGCTTGA CTTTAAATTC 
TAA

Protein sequence

MKRTIKLAVV AALALGTTSA FATNGDTMIG VGAKAIGMGG VGIGVSHGAE SALTNPAMIT 
NVEGTEISFG GTIFMPDVKT NMGDGSGFHN SDADLSVIPS VAIAQKVSNN FYWGIGMYGV 
AGMGTDYRDA TGGMANMNMV TNLQLMQFVV PLAYKANGFS LGIAPILQYG SLDINYDMSA 
MYMAAPGTNM STTRGVAQDF GLGYNVGVAY ETAGLTVGAS YKSKIDMEYK GQISRAMKDF 
TGFLGSDSLE QPAEIGVGAS YKVSGNTFAI DYKQIKWSDA KGYKDFAWDN QNVIMVGYQY 
AQDNWALRAG YNHAKSPIKD QGMAGSLSNV FNLLGFPAIV ESHYTVGASY GFSKMTSLDL 
AYVYSPEASE NYAYSLGGPA TTIETKHSQS AVTAQLDFKF