Gene Avin_12090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_12090
Symbol	pilB
ID	7760150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	1161999
End bp	1163699
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	64%
IMG OID	643804110
Product	type IV pilus assembly protein
Protein accession	YP_002798409
Protein GI	226943336
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID	[TIGR02538] type IV-A pilus assembly ATPase PilB

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACGACG ACATTTCCCT CCACGGTCTG GCACGGCAGA TGGTGCTGGC CGGACTGATC 
GACGAGAAGA CGGTCCTGCA GGCCCAGCGG CAGGCACAGC GCAACCAGAC CCCACTGGTC 
ACCTGGCTGG TGCAGAACAA GCTGGTCAAG AGCCGGGGGT TGGCGGAGCT GGCCGCGGAG 
CAGTTCGGCA TCGCCCTGTT CGATCTCGGG ACGCTGGAGC GGGAAAACCA GCCCCGCGAC 
CTGCTCAGCG AGAAACTGAT CCGCCAACAT CGCGCTCTGC CGTTGTGGCG GCGCGGCAAC 
CGGCTGTTCG TGGCGATTTC CGACCCGACC AACCACGAGG CAATTCGTGA GATCCGCTTC 
GGCACCGGGC TGAACACCGA AGCCATCCTG GTCGAGGACG ACCGTCTGGG CGAAGCCATG 
GAGAAGTACT TCGAGGGCGC CGACACCGCC CTGGACGATC TCGCAGACGC CGGGCTGGAC 
GGCCTCGATA TCGAAGCCGG CGACCGGCAT GACGAAGCGC TCAATCCGGC CGGAGATGCC 
GAAGATGCGC CGGTGGTGCG CTTCATCAAC AAGATATTGC TGGATGCGAT CCGCCGCGGC 
TCCTCGGATC TGCACTTCGA ACCCTACGAG AAGAGCCACC GGGTGCGTTT TCGCACCGAC 
GGCATCCTCC ATGAGGTGGC CCGGCCGCCC GTCCGGTCGG CGCCGAAGAT CGCCGCGCGC 
CTGAAAGTGA TGGCCGGGCT GGATATCTCC GAGCGGCGCA AACCGCAGGA CGGTCGGATC 
AGGATGAAGC TGCCGAAGGG CAAGGCCATC GACTTTCGGG TCAACACCCT GCCCACGCTG 
TGGGGCGAAA AGGTGGTGAT GCGGATTCTC GACCCGTCCA GCGCGCAGAT GGGTATCGAT 
GCCCTCGGCT ACGAGGAGAG CCAGAAGGCG CTCTACCTGG AGGCACTGAG CCAGCCGCAG 
GGCATGATCC TGGTGACTGG TCCGACCGGT TCGGGCAAGA CGGTGTCCCT GTATACCGGC 
CTGAACATTC TCAATACCGC GGAGGTGAAT ATCTCCACCG TCGAGGACCC GGTGGAAATC 
AACCTGGAAG GCATCAACCA GGTCAACGTC AACCCACGCC AGGGCATGGA CTTCTCCCAG 
GCGCTGCGCG CCTTCCTGCG CCAGGACCCG GACATCATCA TGGTCGGCGA GATCCGCGAC 
CTGGAAACCG CGGAGATCGC CATCAAGGCC GCACAGACCG GCCACATGGT GATGTCCACC 
CTGCACACCA ACAGCGCGGC GGAAACCCTG ACCCGCCTGC GCAACATGGG GGTGCCCTCC 
TTCAATATCG CCACCTCGGT GAACCTGATC ATCGCCCAGC GCCTGGCGCG CAAGCTGTGC 
GCCTGCAAGC AGGCGGTGGA CATTCCCCAC GAAACGCTGC TCGCCGAGGG ATTTCCGGAA 
GAGCGCATCG GCGCCTTCAG GCTTTATGCC CCGACCGGTT GCGAGAACTG CAACGGCGGC 
TACAAGGGCC GGGTCGGCAT TTATGAAGTG GTTAAAATCA CTCCGGCCCT GCAGCGCATT 
ATCATGGGGG ACGGCAACTC CATCGATATC GCCCGGCAGA TGCGCGCCGA GGGTTTCAAC 
GACTTGCGCG CATCGGCCCT GTGGAAAGCA ATGCAGGGCG TCACCAGCCT GGAAGAAGTC 
AACCGCGTCA CCAAGGACTA G

Protein sequence

MHDDISLHGL ARQMVLAGLI DEKTVLQAQR QAQRNQTPLV TWLVQNKLVK SRGLAELAAE 
QFGIALFDLG TLERENQPRD LLSEKLIRQH RALPLWRRGN RLFVAISDPT NHEAIREIRF 
GTGLNTEAIL VEDDRLGEAM EKYFEGADTA LDDLADAGLD GLDIEAGDRH DEALNPAGDA 
EDAPVVRFIN KILLDAIRRG SSDLHFEPYE KSHRVRFRTD GILHEVARPP VRSAPKIAAR 
LKVMAGLDIS ERRKPQDGRI RMKLPKGKAI DFRVNTLPTL WGEKVVMRIL DPSSAQMGID 
ALGYEESQKA LYLEALSQPQ GMILVTGPTG SGKTVSLYTG LNILNTAEVN ISTVEDPVEI 
NLEGINQVNV NPRQGMDFSQ ALRAFLRQDP DIIMVGEIRD LETAEIAIKA AQTGHMVMST 
LHTNSAAETL TRLRNMGVPS FNIATSVNLI IAQRLARKLC ACKQAVDIPH ETLLAEGFPE 
ERIGAFRLYA PTGCENCNGG YKGRVGIYEV VKITPALQRI IMGDGNSIDI ARQMRAEGFN 
DLRASALWKA MQGVTSLEEV NRVTKD