Gene Dret_1103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1103
Symbol
ID	8418928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1294039
End bp	1295754
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	56%
IMG OID	645037675
Product	type IV-A pilus assembly ATPase PilB
Protein accession	YP_003197969
Protein GI	258405227
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID	[TIGR02538] type IV-A pilus assembly ATPase PilB

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.202418
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00743342
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGCCAAGC AGACGACCAC CGAGGCCCTG AAACAATGGG CCCAATTCAC TGCAGAAGAA 
ATCAGGGACA TAGAAGAACT CCAGCGTCAG AAGCGGACCA GCTTTCTTGC GGCGGCGTTC 
GATAAAGATA TCCTCAGGGA CCAGGACTAT CTGGAATTTC TTTCCCAACG TCTGTCCATG 
CCGTGCGCTG CGCCGGAACT TTTTGATATC GCTCAGGATA TCTTTGAACT TGTGCCTTCA 
GAGTTGTGCC GCAAGTACGA GGCGGTCCCG TTCTTCCGCC ACAACAACAC CCTGTTCATC 
GCCACCGCCG ACCCGGAAAA TCTCCTCGCC CTTGACGACA TCCGTTTTGT GACCGGCATG 
GAACTCGCCG TGCACATCGC CACGCCCACG AGCATCGCTG TCAGTCTGGA GAACTATCTT 
AAAGGCGAAG AGTCTGGCGG GAATTTTGGC GATTTGGACG AGGCCCTGGC CGACATTGCC 
GAGTCCGATG TTGAAATTTC GCGCAAGAGC GAGGAATCCG CTTCGGAAGA ACCTTCGGTG 
CTCGAGGCCG CTTCTCAGGC TCCTGTGGTC AAGATGGTCA ACCTGATCAT CATGGACGCC 
ATCCGCAAGA AGGCGTCGGA TATCCATATT GAACCCTATG AAGAACTTTT CCGAGTCCGT 
TTTCGTATCG ACGGTGTCCT GCAGGAGGTC ATGCGGCCGC CGATGCGCTT GCGCAATGCG 
ATCATCTCCC GTTTGAAAAT CATGTCCCAC ATGGATATCG CCGAACGGCG ACTGCCCCAG 
GATGGCCGGG TCAAGGTCCG GACCCCCGGA GGGTTGGAGG TCGAATTCCG GGTTTCGGTC 
TTGCCTCTTT TGTACGGGGA AAAGGTGGTC ATGCGCCTGT TGGACAAGAG TTCGCTCAAT 
CTTGACCTGC GGGATCTGGG GTTGGAAGAC AGCGCCTTGG AGATCCTCCA GCGCGCCATC 
ATCAAACCGT ACGGAATGAT ACTGGTTACC GGCCCAACAG GCAGCGGAAA GACGACCACC 
TTGTATTCGG CGATCATGGA ACTCAACAAG CAGGAAGTGA ATATCGCCAC TGCCGAAGAC 
CCGGTGGAGT ATAGTCTGGA AGGGGTCAAC CAGGTCCAGG TCCGCGATGA TATCGGCTTG 
ACATTTGCCG GGGCCTTGCG CTCCTTTTTG CGTCAGGATC CGGACATTAT TCTTGTGGGT 
GAGATCCGGG ATCTGGAAAC CGCCGAAATC GCCGTCAAAG CGGCTATGAC CGGCCACCTT 
GTTCTTTCCA CCCTGCACAC CAATGACGCG CCACGGACTT TGACGCGCCT GATGAACATG 
GGGGTCGAAG AATATCTGAT CGCTTCGTCG GTCAATGCCA TTGTTGCCCA GCGTCTGGTG 
CGCAAACTCT GCCCCTTTTG CAAACAGGAC ACCGAGCTTT CGCAACCGGT CCTGGACGCC 
CTGGGCATTG ATCCCGCCAC CTGGGACGAC AGCCAGGTCT GTGCCCCGCG TGGATGCCCG 
AAATGCAACA ATACCGGGTA CAAGGGGCGC ATCGGTCTGT ACGAGGTCCT TGAAGTTACT 
GAAACTATGC AGGAATTGAT CCTGCAGCGC GCCAGTGTCC CCCATATTCA CGCCCTGGCC 
ATAGAAGAGG GGATGTTGAC CATGCGTCAA AGCGGTATCG AAAAAATCCG CCAGGGAATC 
ACTTCGGCCC AGGAAGTGCT CAAAGTAACG GCGTAA

Protein sequence

MAKQTTTEAL KQWAQFTAEE IRDIEELQRQ KRTSFLAAAF DKDILRDQDY LEFLSQRLSM 
PCAAPELFDI AQDIFELVPS ELCRKYEAVP FFRHNNTLFI ATADPENLLA LDDIRFVTGM 
ELAVHIATPT SIAVSLENYL KGEESGGNFG DLDEALADIA ESDVEISRKS EESASEEPSV 
LEAASQAPVV KMVNLIIMDA IRKKASDIHI EPYEELFRVR FRIDGVLQEV MRPPMRLRNA 
IISRLKIMSH MDIAERRLPQ DGRVKVRTPG GLEVEFRVSV LPLLYGEKVV MRLLDKSSLN 
LDLRDLGLED SALEILQRAI IKPYGMILVT GPTGSGKTTT LYSAIMELNK QEVNIATAED 
PVEYSLEGVN QVQVRDDIGL TFAGALRSFL RQDPDIILVG EIRDLETAEI AVKAAMTGHL 
VLSTLHTNDA PRTLTRLMNM GVEEYLIASS VNAIVAQRLV RKLCPFCKQD TELSQPVLDA 
LGIDPATWDD SQVCAPRGCP KCNNTGYKGR IGLYEVLEVT ETMQELILQR ASVPHIHALA 
IEEGMLTMRQ SGIEKIRQGI TSAQEVLKVT A