Gene Avin_04840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_04840
Symbol
ID	7759441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	453797
End bp	455581
Gene Length	1785 bp
Protein Length	594 aa
Translation table	11
GC content	69%
IMG OID	643803405
Product	type II secretion system protein E
Protein accession	YP_002797713
Protein GI	226942640
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.348138
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTCCA TCGCATCTCC CACCGAGGAC CGCCGGCTCG ATCCGGGCGA GCTGTTGCGC 
GAGCTGGTCG CCTGCGGCCG GATCGACCGG GACAGCGCCG AGCGCTGCCT GGCGATCCAG 
CGCAGCACCC CGGACAGCCG ACAGCACCCA CTCGAGTCGC TCGCCGCCCA ACGGCTCGAC 
GACCGCCTCC GACCCGGCCG CAAGCTCGAC CTGGAAAGCC TCACCCAGTG GCTGGCCGAC 
CATGCCGGGC AACCCTACCT GCGTATCGAC CCGCTGAAGC TCGACGTCGC CGCGATCACC 
CCGCTGATGT CCCGCGCCTT CGCCCAGCGC CACGGCATCC TCGCCGTGGC GGTCGCGGCG 
GACGGCGTCA CGGTCGCCAG CGCGCAACCT TTCGTCGGCG CCTGGGAGGC CGATCTGGCC 
CAGGCACTCA GGCGGCCGAT CCGCCGGGTG GTGGCCAACC CCGTCGACAT CCGCCGCTTC 
ACCCAGGAGT TCTACCGCCT GGCCAGGTCG GTCAGCGGCG CCTCGGCCCC GGAGCAGAAG 
AGCGCCGGCA CCGGCAACTT CGAGCAGTTG TTCAGGCTCG GCGCGGCGGA CCGGGAGCCG 
GACGCCAACG ACGCGCACAT CGTCACCATC GTCGACTGGC TGCTCCAGTA CGCCTTCGAG 
CAGCGCGCCA GCGACATCCA CATCGAGCCG CGCCGCGAGG CCGGCAGCGT GCGCTTTCGC 
ATCGACGGCG TGTTGCACAA CGTCTACCGG TTCCCGTCGC AGGTGAGCAT GGCGGTAGTC 
GGCCGGCTGA AGAGTCTCGG CCGGATGAAC GTCGCCGAGA AGCGCAAGCC GCAGGACGGC 
CGGGTCAAGA CCAGAAGCCC GGACGGCGGC GAGATCGAGC TGCGCCTCTC GACCCTGCCG 
ACCGCCTTCG GCGAGAAGCT GGTGATGCGC ATCTTCGACC CCGAGGTATT GCTCAAGAGC 
TTCGACGCCC TCGGTTTTTC CGCCGACGAC CTGCGGCGCT GGCGGAGCAT GACCGACCAA 
CCCAACGGCA TCGTCCTGGT CACCGGCCCG ACCGGCTCGG GCAAGACCAC CACCCTCTAC 
ACCACGCTGA AACAACTGGC GACGCCGGAA GTCAACGTCT GCACCATCGA AGACCCCATC 
GAGATGATCG AACCGGCGTT CAACCAGATG CAGGTGCAGC GCAACATCGA TCTGGACTTC 
GCCAGCGGCG TGCGCGCGCT GATGCGCCAG GACCCGGACA TCATCATGAT CGGCGAGATC 
CGCGACCTGG AAACCGCCGA GATGGCCATC CAGGCGGCAC TCACCGGTCA CCTGGTGCTC 
TCCACCCTGC ACACCAACGA CGCGCCCGGC GCCATCGCCC GCCTGCTCGA GCTGGGCGTG 
CCTCATTACC TGATCAAGGC CACCCTGCTC GGAGTCATGG CCCAGCGCCT GGTACGAACC 
CTGTGCCCGC ACTGCAAGGC GCCGGTCAGC CTCGATGCGG CCGACTGGCA GGCCCTCACC 
CGTCCCTGGA ACGCCCCGCC GCCGAGCGCT GCGCAGCGGG CGGTGGGCTG CGCCGAATGC 
CGCGACACCA GCTATCGCGG GCGCGCCGGA GTCTACGAGA TCATGCTGCT GAACGATGCC 
CTCAAAGCGC TGATCAAAAC CGATACCGAC CTGCTCGCGC TGCGCCGCGC CGCCTTCAGG 
GACGGCATGC GCAGCCTGCG TCTGTCCGGC GCGCTGAAGG TCGCCGCCGG CTCGACCACC 
CTCGAAGAAG TCATGCGCGT CACCCCGCAG AGCGATCGGC AGTGA

Protein sequence

MPSIASPTED RRLDPGELLR ELVACGRIDR DSAERCLAIQ RSTPDSRQHP LESLAAQRLD 
DRLRPGRKLD LESLTQWLAD HAGQPYLRID PLKLDVAAIT PLMSRAFAQR HGILAVAVAA 
DGVTVASAQP FVGAWEADLA QALRRPIRRV VANPVDIRRF TQEFYRLARS VSGASAPEQK 
SAGTGNFEQL FRLGAADREP DANDAHIVTI VDWLLQYAFE QRASDIHIEP RREAGSVRFR 
IDGVLHNVYR FPSQVSMAVV GRLKSLGRMN VAEKRKPQDG RVKTRSPDGG EIELRLSTLP 
TAFGEKLVMR IFDPEVLLKS FDALGFSADD LRRWRSMTDQ PNGIVLVTGP TGSGKTTTLY 
TTLKQLATPE VNVCTIEDPI EMIEPAFNQM QVQRNIDLDF ASGVRALMRQ DPDIIMIGEI 
RDLETAEMAI QAALTGHLVL STLHTNDAPG AIARLLELGV PHYLIKATLL GVMAQRLVRT 
LCPHCKAPVS LDAADWQALT RPWNAPPPSA AQRAVGCAEC RDTSYRGRAG VYEIMLLNDA 
LKALIKTDTD LLALRRAAFR DGMRSLRLSG ALKVAAGSTT LEEVMRVTPQ SDRQ