Gene Dret_1137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1137
Symbol
ID	8418964
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1333395
End bp	1334576
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	60%
IMG OID	645037711
Product	Extracellular ligand-binding receptor
Protein accession	YP_003198003
Protein GI	258405261
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0165472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.816566
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCAAT TGCCCAATTT TTCCCGCTGT GCCCTTTGTC TCGGCGCGCT TTTTCTCGCG 
CTGGCCCTGG CGGCCTGTCA GGACTCCACA TCGTCCCAGG ACCAGGCCCA GAACCAGGAG 
GATCAGACCC AGGCCCTGAA GATAGGAGCC GTTTTACGTC TCTCCAAAGG CGCCTCCGAT 
GGATTGCCGG CCCGCCACGG TATTGAAATC GCTGTGCAGG AAATCAACTC CCAGGGCGGC 
ATCGACGGCC GGCCCCTGGA AGTTGTCTAC TACGACAGCA AGGACGACGC GACGACGGCT 
GTGAACGCGG TCCAGAAACT CATTTCCGTG GACGAGGTCG AGGCCATCAT CGGTCCGATG 
ATGAGCGGCA ATGTCCTGGC CGCTGCCCCA CTGTGTCAGC GCAACAATGT GGTTTTGCTC 
ACTCCCACCG GCACCTCGCC GCGCATCTCC GAGGCCGGAT CGTATACCTT CCGCCTCTGT 
TCCCGCATCG ACGATCAGGC CCGGGCCCTG GTCCAGGAAG CCCTGAGCCG AGTTGGAGCG 
GACCCGACCG TGACTATCCT CTACAGCAAC GAACCCTACG GCAAGGGGTC CAAAGAACTC 
TTCACGCGCT ACCTTGCCGA GCAGGACATC ACTCCGGCCA CTGTGGAATC GTTCCAGCGC 
GGCGACAAAG ACTTCCAGGC CCAGCTGACC AAGATCAAAC AACTCAATCC GGACATCCTC 
TTTGTCCCCG GATATCTCCA GGAAACCGCT CCGCTGATCA GCCAGGCCCG GCAGATGGGG 
ATCAATGCCC TCAGCGTCGG TGTTTTCGGT GATATGGCCC CGAAATATAT TGAACTAGCC 
GGCAAGGCCG CTGAAGGCCA CCTCATCGCT GGTGAATACA ATAAGCACAA GGACACCGAA 
CACAACCAGG ACTTTGTCAA CGCCTATGAG GCGCTTCTGG CGGATCAGCC CAAGGCCCCG 
GAAAACATCA TGTTCGCGGC TTTGACCTAC GACGCGGTCC ATCTTTTGCG GCAGTCCTTC 
AGCACCGGGG CGACCACGGG CAGCGCCATC CAGTCCTTCC TGGACGAGTT GGAGGCCTTT 
GACGGCATCA CCGGGACACT TTCCTTCGAT GCTAACGGGG ACGTCCAAAA AGGCGGGGTC 
TACCTCTTTG AGGTCCAGAA CGGGACCTAC CGTAAACTGT AA

Protein sequence

MPQLPNFSRC ALCLGALFLA LALAACQDST SSQDQAQNQE DQTQALKIGA VLRLSKGASD 
GLPARHGIEI AVQEINSQGG IDGRPLEVVY YDSKDDATTA VNAVQKLISV DEVEAIIGPM 
MSGNVLAAAP LCQRNNVVLL TPTGTSPRIS EAGSYTFRLC SRIDDQARAL VQEALSRVGA 
DPTVTILYSN EPYGKGSKEL FTRYLAEQDI TPATVESFQR GDKDFQAQLT KIKQLNPDIL 
FVPGYLQETA PLISQARQMG INALSVGVFG DMAPKYIELA GKAAEGHLIA GEYNKHKDTE 
HNQDFVNAYE ALLADQPKAP ENIMFAALTY DAVHLLRQSF STGATTGSAI QSFLDELEAF 
DGITGTLSFD ANGDVQKGGV YLFEVQNGTY RKL