Gene Hoch_4828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4828
Symbol
ID	8547235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	6607927
End bp	6609618
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	62%
IMG OID	646389502
Product	type IV-A pilus assembly ATPase PilB
Protein accession	YP_003269211
Protein GI	262198002
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID	[TIGR02533] general secretory pathway protein E [TIGR02538] type IV-A pilus assembly ATPase PilB

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.436741
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGAA TTGGCGAACT CCTCGTTCGT GAGAAAATGA TCACGTCCGA TCAGCTAAGG 
GAGGCGCAGA GTGAAGCCCA GCGCAGTGGT CTGCGACTGG GTTCTGCGTT GGCGAATCTC 
GGGATAGTCG ACGACGACCA GCTATCGAAG TTCGTCGCCA GTCAATACGG CCTGAAGACA 
GTCAATCTCA ACAGCTACAC GCTCGATCCA GAGCTGTTGA AATTGATCCC CAAGGACGTT 
GCCCAGCGCC ACCAGGTGGT GCCGCTGGAG CGAGCTGGCT CGAACTTGAC CGTGGCGATG 
TCGGATCCGT CCAACATCTA CGCGATCGAC GAGCTGAAGT TCCTAACGCA GTACAACATC 
CGCCCGGTCG TGGCGTCCGA GAACGCCATC GAGGGCGCGA TCCAGCGCTA CTACGACAAG 
GGTCCGAACC TCCACGAGAT GATCGGGGAT CTCGACGAGG ACGTCGACTT CGCCGCGGCC 
GACGAGGAGT CGGTCAACAT CGTCGACCTC GAGAACCAGG CCGGCGAAGC GCCCGTGGTC 
AAGCTGTGCA ACGCCATCCT GTTGTCGGCG ATCAAAAAGG GCGCCTCGGA TATCCACGTC 
GAGCCCTACG AGAAGAGCTT CCGGGTGCGC TTCCGCATCG ACGGCATCCT CCACGAGGAG 
ATGAACCCGC CGCTGCGCCT GCGCAACGCG ATCACCAGTC GACTCAAGAT CATGTCGAGT 
CTGGATATCG CCGAGCGGCG TCTGCCGCAG GACGGCCGCA TCAAGCTCAA GATCGGCAAA 
GACCGCGAGA TGGACTTCCG CGTCTCGTGT CTGCCGACGC TCTTTGGCGA GAAGATCGTC 
CTGCGTCTGC TCGACCGCTC GAACCTGCAG CTCGACATGA CCCGCCTGGG TTTCGAGCCC 
GAGCCGCTGT CGTACTTCAA AAAGGCCATC CACCTGCCCT ACGGCATGGT GCTGGTGACC 
GGGCCGACGG GCTCTGGCAA GACGACTACG CTGTACTCGG CGCTGTCCGA GCTCAACACT 
ACCGAGAGCA ACATCAGCAC GGCTGAGGAT CCGGTGGAGT TCAACCTACC CGGCATCAAC 
CAGGTGCAGA TGCACGAGGA CATCGGCCTC AACTTCGCGA CCTCGCTGCG CTCGTTCTTG 
CGCCAGGATC CCAACATCAT CATGGTCGGC GAGATCCGCG ACTTCGAGAC CGCCGAGATC 
GCGGTGAAAG CCGCGCTCAC GGGCCACATG GTGCTGTCCA CGCTGCACAC CAACGACGCC 
CCCTCGACGG TCTCGCGCCT GCTCAACATG GGCGTCGAGC CGTTTTTGGT CACCGCGTCC 
GTCAACCTGG TGTTGGCCCA GCGCCTGGCG CGCCGCATCT GCGTCGAGTG CAAAGAGGAG 
ACCGAGAAGC ACCCCGAGGC GCTGCGCGAC GTCGGCATGA GCGAGGACAT GATCGCCGCG 
TGCAAGCCGA TGGTCGGCCG CGGCTGTAGC TTCTGCGGCG AGACCGGCTA CCGCGGCCGC 
GTCGCGCTCT ACGAGGTCAT GCCCTTCACC GACGATCTCA AGGAGCTGGT GCTGCAGAAC 
GCATCGGCGG CCGAAATAAA AATGGAGATG ATCCGCGGCG GGGTGCAGAC CCTGCGAATG 
GCCGGCCTCA ACAAGATCAT GGAGGGCATG ACCACGCCGG AAGAGGTCAT GCGAACCACG 
GTGGCAGACT GA

Protein sequence

MSRIGELLVR EKMITSDQLR EAQSEAQRSG LRLGSALANL GIVDDDQLSK FVASQYGLKT 
VNLNSYTLDP ELLKLIPKDV AQRHQVVPLE RAGSNLTVAM SDPSNIYAID ELKFLTQYNI 
RPVVASENAI EGAIQRYYDK GPNLHEMIGD LDEDVDFAAA DEESVNIVDL ENQAGEAPVV 
KLCNAILLSA IKKGASDIHV EPYEKSFRVR FRIDGILHEE MNPPLRLRNA ITSRLKIMSS 
LDIAERRLPQ DGRIKLKIGK DREMDFRVSC LPTLFGEKIV LRLLDRSNLQ LDMTRLGFEP 
EPLSYFKKAI HLPYGMVLVT GPTGSGKTTT LYSALSELNT TESNISTAED PVEFNLPGIN 
QVQMHEDIGL NFATSLRSFL RQDPNIIMVG EIRDFETAEI AVKAALTGHM VLSTLHTNDA 
PSTVSRLLNM GVEPFLVTAS VNLVLAQRLA RRICVECKEE TEKHPEALRD VGMSEDMIAA 
CKPMVGRGCS FCGETGYRGR VALYEVMPFT DDLKELVLQN ASAAEIKMEM IRGGVQTLRM 
AGLNKIMEGM TTPEEVMRTT VAD