Gene Dole_0330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0330
Symbol
ID	5693149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	379659
End bp	380639
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	60%
IMG OID	641262911
Product	hypothetical protein
Protein accession	YP_001528217
Protein GI	158520347
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3168] Tfp pilus assembly protein PilP
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000177354
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCGCG TGCGTAAAAA CCTTATTATC TGTTTAGTGT GTGTCTGCCT GGCGGCGGGT 
GTGGGATGCA AGAAGGGGGC TGACAACCCC CCGGAGCAAG CCGAGCCTGC GCGGCAGACC 
ATTTCCATGG AACAGCCGGC GCCGGCCCCC CCGGCGGAAC AACCGACAGC GCCTGAGGTG 
ATGGTTGTTG AAGAGGAGGC TCCGGGACCA ATGGTGGTGA CAGGCACGCC GCAGGTTCCG 
GCCGAAACAA CGCCCCCGGC ATCCGGACCG GCAACAGAAA CAGAACCGGT GGCAAAAAAG 
GCGGCCGAAG GGCCTTCGGC CGAGGAGCAG CAGGCACCGT CCGATATGCC GCCCACACCT 
GCTGAGGAGC CGCCGGCCCC ACCGGTGGAA GCCGTTTCCG ATTCCCCGGC GCTGACGGAT 
ACAGCCGATC CGGAAGAAAC GGATATCGCC CTGCCGACAT CGGAAGTGGA AGCAGGCGCG 
GGAACAGTGG ATGGCACTGC CATGGAAACA ACGGATGAAA TGGAAGAAGC GCCTGCTGAC 
GACGTTGCGT CTGAAATCAA AATCGTGATC GACCTGATGG GAGAAGAGGA CCTTGATGCT 
GAAGAAGCCG CCAAGACAAC GGCCGAGAAC CAGGCGCTGG CCATGTTCAG CCCGTTTACT 
CCCCTTTTCC AGAAAGACGC AAGCGAAGAT GACATGTTTC TGGAACAGGA CTCCCAGCGG 
AAACGGGCCT TTTTAACCCC CCTGGAGCGA ATCAGCCTGG GCCAGTTACA ACTGTCCGGC 
ATCATCCGGG CCGCCAGCGG CAACCGGGCC ATTGTGACCG ACGCCACAGG CAAGGGATAT 
GTGGTCAAAA AAGGTACCTA CATCGGGCTG AATTCCGGCC AGGTGGAAGA GATTGTGGAT 
GATCGCGTGA TTGTTGTAGA GATGGTCGGC GGACGCAGGG CCGTAACCGA ATTGAAACTT 
CAGAAACCAG CTGGAGAATA G

Protein sequence

MMRVRKNLII CLVCVCLAAG VGCKKGADNP PEQAEPARQT ISMEQPAPAP PAEQPTAPEV 
MVVEEEAPGP MVVTGTPQVP AETTPPASGP ATETEPVAKK AAEGPSAEEQ QAPSDMPPTP 
AEEPPAPPVE AVSDSPALTD TADPEETDIA LPTSEVEAGA GTVDGTAMET TDEMEEAPAD 
DVASEIKIVI DLMGEEDLDA EEAAKTTAEN QALAMFSPFT PLFQKDASED DMFLEQDSQR 
KRAFLTPLER ISLGQLQLSG IIRAASGNRA IVTDATGKGY VVKKGTYIGL NSGQVEEIVD 
DRVIVVEMVG GRRAVTELKL QKPAGE