Gene Dhaf_3559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_3559
Symbol
ID	7260577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	-
Start bp	3782708
End bp	3783733
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	48%
IMG OID	643563482
Product	aminodeoxychorismate lyase
Protein accession	YP_002460013
Protein GI	219669578
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00000155777
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAGAC GCTGGTTAAA AGGTCTGCTC AGTACTTTAT TTATTATGGC AGTTCTTGCG 
GGAGCAGGAA TCGCAGCTTG GTGGAACTGG GCGAGCCAAC CCTACGCTGA GGAAGGAAGC 
AATGCTGCAG AAGTGCAGTT TATGATAACT CCGGGAATGA ATGCCTCTCA AGTTGCTCAG 
GAACTGGAAC ATCAGGGGCT TATCCGCAAT GCCCTGGCCT TTCGCTTTTT GGCCAGTCAG 
CAAAATGTGG ATTCCAAGCT GCTGGCGGGA GAGTACCAGC TTTCCGCCCA AATGCCCCCC 
CAGGAAATGA TTAATAAGAT TCTTGAGGGA CCTGACGTGC ATACTGTAAA GGTCACCATT 
CCCGAGGGAT ATACGACAGC CCAGATTATT GATCTATTTG TAAAGAATGA CTTGGGAAGC 
AAAGAGGATT ATCAGAGGGT TATTGAAAGC GAGCCTTTCA GTTATTCTTT TCTTGCCGAT 
ATCCCTGCGG GACCGAACCG GCTGGATGGT TTTCTTTTTC CTGATACCTA CTTCTTTGCT 
CCGGAGGCCG GTCCTAAGGA AAACATCAAT CGAATGCTTA AACGCTTTGA ACAGGAAATA 
ACCCCGGAAG TGATGACTAA ATTGGCAGAA ATGAATCTTA CGCTGCGGGA GTGGGTGAAT 
CTCGCTTCCA TCGTAGAAAA GGAAGCAGGC AAGGATGCGG ACCGTCCGAT TATCGCCGGA 
ATTTTCCTTA ATCGCCTCAA GATCGACATG GCCCTCCAAT CCTGTGCCAC CATTCAATAT 
GTACTGGGAA CTCAGAAATA TATCCTCTCT TTAGAAGATA TCCAGGTGGA GTCTCCTTAT 
AACACCTATA AGTATCCGGG ATTGCCGCCC AGCCCCATTG CCAGTCCTGG GCATGCCTCT 
CTGGATGCAG TGCTCAACAG CACGGATTCC GATTACCTAT ACTTCTTAGC TACTCCAAGT 
GGTGAGACGA TTTATGCGAA AACCCATCAG GAGCATTTGC AGAATCAGGC CAAGTATATG 
AATTAA

Protein sequence

MGRRWLKGLL STLFIMAVLA GAGIAAWWNW ASQPYAEEGS NAAEVQFMIT PGMNASQVAQ 
ELEHQGLIRN ALAFRFLASQ QNVDSKLLAG EYQLSAQMPP QEMINKILEG PDVHTVKVTI 
PEGYTTAQII DLFVKNDLGS KEDYQRVIES EPFSYSFLAD IPAGPNRLDG FLFPDTYFFA 
PEAGPKENIN RMLKRFEQEI TPEVMTKLAE MNLTLREWVN LASIVEKEAG KDADRPIIAG 
IFLNRLKIDM ALQSCATIQY VLGTQKYILS LEDIQVESPY NTYKYPGLPP SPIASPGHAS 
LDAVLNSTDS DYLYFLATPS GETIYAKTHQ EHLQNQAKYM N