Gene Dret_0180 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0180
Symbol
ID	8417984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	228572
End bp	230395
Gene Length	1824 bp
Protein Length	607 aa
Translation table	11
GC content	60%
IMG OID	645036745
Product	extracellular solute-binding protein family 5
Protein accession	YP_003197060
Protein GI	258404318
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0115715
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTGGT TGTTGTACCG CCTTGCCATC CTGCTCATGG CGAGCACCTG CTGCGTCCTC 
CCTGTGCGCT CGGCCTTTGC CGCCCACGCC CTGGCCATGA ATGGTGAACC AAAATACAGC 
GCTGACTTCA CCCATTTTGC CTACGCCAAT CCGCAGGCGC CCAAGGGCGG TCATGTCCGC 
CGAGCCGCCA TCGGCACCTT TGACACCTTC AATCCCTATG TTCCCAAAGG CATGGCGCCG 
CAGGGAATCG GCCTTATCTA CGACACCCTG TGTGTCCAGT CCATGGACGA ACCATTCACG 
GCTTACGGCC TTCTGGCGCA AGACATAACC GTGCCCCCGG ATCGCTCCTG GGTGCGCTTT 
ACGCTTCGCG AAAACGCCCG TTTCCACGAC GGCCACCCCG TGCACGCCGA GGATGTGGCC 
TTCACTTTTG AGCTGCTCAT GGCAAAAGGG AGTCCAACAT ATGCAAACTA TTACGGGGAC 
GTGAGCGAGG TCGAGGTTCT GGGCCCCAGA CAAATCCGCT TCACTTTCGA GCACGCCAAC 
AACCGTGAAC TGCCGCTTAT CCTCGGCCAG CTGCCGGTGC TGCCCAAGCA TTTCTGGAAA 
GGGAAGGATT TCACTTCAGC CGGATTGACA CGCCCCCTGG GCAGCGGCCC GTATACCATC 
GAGACGTTCA AGCCCGGACA TTTTGTGCGC TACAAACGCG TTGCCTCCTA TTGGGGCGCT 
GACCTTGCCG TGAACACCGG GCGCTACAAT TTTGATTCCC TGCAATACGA CTATTTTCGG 
GACACCACTG TGGCCTTGGA GGCATTCAAG GCCGGTGAGT ACGATTTCCG ACAAGAAAAC 
ACCGCCAAAC ACTGGGCCAC GGCCTACACC GGTCCAGCGG TGGACCAAGG GCATATTGTC 
AAGGAACGCA TCCCCCATGA CCGACCTCAA GGTATGCAGG CCTTTATCTA CAACACCCGG 
CGGCCTCTGT TCAGCGATCC CGAAGTCCGG CGGGCCTTGG CCTACGCCTT TGATTTCGAA 
TGGACCAACT CCCAGCTGTT TTACGGCCAG TACACGCGGA CCAAAAGTTA TTTTTCCAAT 
TCTGAACTCG CCGCACAGGG ACCGCCTGCC CCGGAGGAAC TGGCTCTGCT CGAACCGCAC 
CGCAGCCACC TCCCCGAAGA AGCACTGACC TCGGCCTACA CCGTGCCCAG CACCGAAACA 
ACGCCCCTGC GCCAAAACCT CCGGCAAGGT CTGCGCCTCT TGCGCCGGGC GGGGTGGACG 
ATGCAAGACG GGCAACTGGT GCACAAGCAA ACGGGAAAAT CGTTTCAATT TACCATATTG 
TTGCGTTCCC CGAGTTTCGA ACGAGTCGTG CTGCCCTTCA AACGCAACCT GGCCAAACTG 
GGGATCACCA TGGAGATCCG CCGCGTCGAT GCCTCCCAAT ATGTCAACAG ATTGCGGAGC 
TTCGATTTCG ACATGCTCAT AGCGACCCTG CCCCAATCCA ATTCACCAGG AAACGAGCAG 
CGGTATTTCT GGACCTCCGA AGCCGCCTCC ACCCCCGGGA CCTACAACTA TATGGGCGTC 
GACAACCCGG CCATCGACGC CCTGGTCGAA CAAGTCGTCA CCGCCCCGGA CAGGGAAAGC 
CTCATCACCC GGTGCCGCGC CCTGGACCGC GCCCTGTTGT GGGGACACTA CGTCATTCCC 
CAATGGCATC TCGGGGCCCT GCGCGTCGCG CGCTGGGATA TTTTCGGTCG CCCGGAAAAG 
ATGCCCCGCT ACGGGCTCGA TTTTTTCACC TGGTGGGTCG ACCCGGACAA GGCCGCTGCC 
GTAAGAGCCT TTCAGGGGCG CTAG

Protein sequence

MSWLLYRLAI LLMASTCCVL PVRSAFAAHA LAMNGEPKYS ADFTHFAYAN PQAPKGGHVR 
RAAIGTFDTF NPYVPKGMAP QGIGLIYDTL CVQSMDEPFT AYGLLAQDIT VPPDRSWVRF 
TLRENARFHD GHPVHAEDVA FTFELLMAKG SPTYANYYGD VSEVEVLGPR QIRFTFEHAN 
NRELPLILGQ LPVLPKHFWK GKDFTSAGLT RPLGSGPYTI ETFKPGHFVR YKRVASYWGA 
DLAVNTGRYN FDSLQYDYFR DTTVALEAFK AGEYDFRQEN TAKHWATAYT GPAVDQGHIV 
KERIPHDRPQ GMQAFIYNTR RPLFSDPEVR RALAYAFDFE WTNSQLFYGQ YTRTKSYFSN 
SELAAQGPPA PEELALLEPH RSHLPEEALT SAYTVPSTET TPLRQNLRQG LRLLRRAGWT 
MQDGQLVHKQ TGKSFQFTIL LRSPSFERVV LPFKRNLAKL GITMEIRRVD ASQYVNRLRS 
FDFDMLIATL PQSNSPGNEQ RYFWTSEAAS TPGTYNYMGV DNPAIDALVE QVVTAPDRES 
LITRCRALDR ALLWGHYVIP QWHLGALRVA RWDIFGRPEK MPRYGLDFFT WWVDPDKAAA 
VRAFQGR