Gene Dole_1542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1542
Symbol
ID	5694379
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1835242
End bp	1836846
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	61%
IMG OID	641264137
Product	TPR repeat-containing protein
Protein accession	YP_001529423
Protein GI	158521553
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00030715
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGGAGG GCATAAGCAG AAAAAAAGTC ATGCAGGGCC TGGTGGTGGC GGTGCTCTGT 
CTGATGGTCT ACTGGCCGTC GCTGAAAAAC GGTTATATCT GGGATGATGA TCAGTATGTG 
TACAACAACC CGGCCGTGAC CCGGCCCGGC GGGCTGAAGG ATATCTGGCT GACCCACAAC 
ATGCCCCAGT ACTATCCCAT GGTGTTTACC AGCTTCCGGC TGGAGCACAT GATATGGGGC 
ACCGACCCGG CCGGATACCA CGCGGTCAAC CTGGCCCTGC ACACGGTAAA CGCCCTTCTG 
GTGCTGGCGG TATTCTCCGC CCTGGCGCCG GGCATCGCCT TTGCCACGGC CCTGTTGTTT 
GCCGTGCATC CCATTCAGGT GGAGACCGTG GCCTGGATAA CGGAGCGCAA AAACCTGCTG 
GCCCTTTTTT TTCTGCTGAT GGCGACGCTC TGGTATCTCC GGCACTACCG GACCGGCAGC 
ACCAGCCACT ACATTGGGAC GCTCCTGTTT TACCTGTGCG CCCTGCTGAG CAAATCGGCA 
GCCGCCTGGT TTGCCGTGGT GCCCCTGGTT TTTGCATGGT GGAAAACCGG CGGCGTCACC 
CGGCGGGATC TGTTAGCGGC TGCCCCCCTG CTGGTCATGG GCGCGGGCGC CGGGCTGCAC 
ACGGCCTGGC TTGAGGCAAA CCGGGTGGGG GCCACGGGAG AGCTCTGGCA CCTGAATTCC 
GTGGAACACG GGCTGCTGGC CGCGCGCATT CTTATTTTTT ACCTGTACAA AATCCTGGCG 
CCTTTTGAAT TTATCTTCTT CTACCCAAGA TGGACCATAG ATGCCACTGC CTGGTGGCAG 
TGGCTTTTTC CGGTACTGGT GGCAGGCGCG GTGTTCGGTG TGATTGCCTT CCGGAAACAG 
ACCCGCCGAG ACGGACCGGC CCTGATGATC CTCTACGGGA CCGCTCTTTT TCCGGTGCTG 
GGATTCTTTA ATGTCTATCC CATGCGCTTT TCCTTTGTGG CCGACCACTT TGCCTACCTG 
GCCACGCCGG TGATCTTTGC CACTGTTGTT GCCGCGGTTT GTCTTACAGG GAGGTCCATC 
AAGGTCCGCT TTTTTACCGA AACGGGGTCA GCAGCCGTTT TCCGCCGGGT GGGCCGGGCG 
GCGGCCGTTG CCGTCATCGT GCTGCTGAGT CTCAAAAGCC TGGGGCTGGT GGAAAACTAC 
AAAAACGAAG TGGCCTTGTG GAAAAGCGTG ACAGCCCAAA ACCCCGCCTC CTATGCCGCA 
TGGAACAACC TGGGCAGCGC CTATGGTAAA ATCGGGCGGC ATCATGCCGC CCTGCCGTGC 
TTTGAAAAGG CCATGGCACT TCGGCCGGAC CTGGCGAGAC ACGCCGTCAA CCTGGGCAAT 
GCCCTTCTGA ATGTGGGGAA CTCAGGCCGG GCCCTTCCCG TTCTGCAACA GGCCGTGGCC 
CTGGCGCCGG ACAATGGCGA GGCCCATCAC CTGGCCGCCA TTGCCTGTTT CAACCTGGGG 
CTGCTTGACT GTGCCCAAAC CCACTGCCGG AAGGCCCTGG ACCTGGGAAC ACGGGTCAGG 
CCGGAACTGA TCGAACGGCT CAGCCGGACC GGTGAGCCGG AATGA

Protein sequence

MVEGISRKKV MQGLVVAVLC LMVYWPSLKN GYIWDDDQYV YNNPAVTRPG GLKDIWLTHN 
MPQYYPMVFT SFRLEHMIWG TDPAGYHAVN LALHTVNALL VLAVFSALAP GIAFATALLF 
AVHPIQVETV AWITERKNLL ALFFLLMATL WYLRHYRTGS TSHYIGTLLF YLCALLSKSA 
AAWFAVVPLV FAWWKTGGVT RRDLLAAAPL LVMGAGAGLH TAWLEANRVG ATGELWHLNS 
VEHGLLAARI LIFYLYKILA PFEFIFFYPR WTIDATAWWQ WLFPVLVAGA VFGVIAFRKQ 
TRRDGPALMI LYGTALFPVL GFFNVYPMRF SFVADHFAYL ATPVIFATVV AAVCLTGRSI 
KVRFFTETGS AAVFRRVGRA AAVAVIVLLS LKSLGLVENY KNEVALWKSV TAQNPASYAA 
WNNLGSAYGK IGRHHAALPC FEKAMALRPD LARHAVNLGN ALLNVGNSGR ALPVLQQAVA 
LAPDNGEAHH LAAIACFNLG LLDCAQTHCR KALDLGTRVR PELIERLSRT GEPE