Gene Dret_1129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1129
Symbol
ID	8418956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1323131
End bp	1324141
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	61%
IMG OID	645037703
Product	aminodeoxychorismate lyase
Protein accession	YP_003197995
Protein GI	258405253
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.399769
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTACT CCAAATTCTT AGCTGGGCTG GTCATTTTCA GCGCCTTCGG GTTTCTCCTC 
TGGGCCGGTG GGTATGCCTA CATGTCCACT CCCATGACCC AACCCGGGCG TGCGATTGAG 
GTTACGATCA ACCCCGGCTG GAACTTCGCC CGGATCAGTC AACTCCTCGA AGACCAAGGC 
GTGATTGATG CCGCCTGGAA GTTCCGCCTT CTGGCCCGCG TCAAACAGAA GACCGGATCG 
GTCCAGGCCG GGGAGTTCCG GCTCCATTCC GGATGGTCCC CGGAAAAAAT CCTTCAGACC 
CTCGTCTCCG GCCGGGCCAT CCTCTACACC TTTTCCATCC CCGAAGGATT GCCCTGGTGG 
GAGGTGGCAA CGAACGCCGG CGAGACCCCG TTGACCACCC GGGAGCGTTT TGCGGCCGCT 
CTTGCGGACA AAGCTTTCCT CGACTCCTGG GATATCCCCA CCGACCACGC CGAAGGATTT 
TTGTTCCCGG AAACCTATTT TCTGCCGCGA CCCGGGGGAA ACGATCCCTA CCCGTTGTTG 
CGAGCCATGT TCCGTCAATT CTGGGATGTC GCCAAAAACC AGCTCTGGCC CGAAGGGCTG 
CCGGATAGTG CTGAGATTGT GCGCACCGTG ACTCTGGCCT CGCTGGTGGA AAAGGAAACC 
GCCCTTCCTG AAGAACGGGC GAGAGTGGCC GGTGTCTTCG CCAACCGGCT CGAACGCGGT 
ATGCGACTGC AATGCGATCC CACCGTGATC TACGGTATCG GTCCCGAATT TGACGGCAAT 
CTCCGCCGCT CCGACCTCCA AAACGCCACC AATCCCTACA ACACCTACCG CCATGCCGGA 
CTGCCCCCCG GCCCCATCTG TTCCCCAGGC CTGGGAGCAC TGCAAGCCAC CCTGCACCCC 
GAGGACCACG AGTATCTCTA TTTCGTGGCC ACCCAAAACG GGGGGCACCA TTTCAGCCGC 
ACCCTGCGTG AGCACAACCG GGCCGTGCGT CGCTATCAGC TCGGGCAATA G

Protein sequence

MTYSKFLAGL VIFSAFGFLL WAGGYAYMST PMTQPGRAIE VTINPGWNFA RISQLLEDQG 
VIDAAWKFRL LARVKQKTGS VQAGEFRLHS GWSPEKILQT LVSGRAILYT FSIPEGLPWW 
EVATNAGETP LTTRERFAAA LADKAFLDSW DIPTDHAEGF LFPETYFLPR PGGNDPYPLL 
RAMFRQFWDV AKNQLWPEGL PDSAEIVRTV TLASLVEKET ALPEERARVA GVFANRLERG 
MRLQCDPTVI YGIGPEFDGN LRRSDLQNAT NPYNTYRHAG LPPGPICSPG LGALQATLHP 
EDHEYLYFVA TQNGGHHFSR TLREHNRAVR RYQLGQ