Gene Avin_14650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_14650
Symbol	apbE
ID	7760401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	1447150
End bp	1448163
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	66%
IMG OID	643804363
Product	thiamine biosynthesis lipoprotein
Protein accession	YP_002798656
Protein GI	226943583
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTGCTGAAGC CCGCCATCGT GGCCGCCTTG GCGGCCACGA TGGCGGGCTG TATGTTTTCT 
GAACAGGTGG AAAGCTTCGT CGGCCCGACC ATGGGCAGTA CCTATTCGGT GAAGTACGTC 
CAGCGCCGGG GAACTCCTGC CAAGGAGGAG TTGCAGCGCG AGACCGAGGC GATCCTGGCC 
GATCTCGATC GACAGGTGTC CACCTACCGT TCCGACTCGG ATATCGAACG CTTCAACACG 
CTTCCCACGG GCAGTTGCGC AGCGGTGCCG GACGAGGTGC GCACCCTGGT GGCCGCCGGC 
GAACGTCTTT CCGTGGAGAG CGAGGGCGCG CTGGATCTGA CCGTCGGCCC CCTGCTCGAT 
CTCTGGGGCT TCGGTCCGCA CGGCCATGGC GAACAGGTGC CGGATGCCGA GGCGATCGCC 
GCGGCGCGCC AGCGCGTGGG GCACCAGTAT CTGCGCATCG ACGGCGAGCG GTTGTGCAAG 
GATGCCCCGG TGCAGGTGGA TTTCAACAGC ATCGCCGCCG GCCATGCGGT CGACCGGGTC 
GCCGCCCGGT TCGAGGCGCT GGGCGTGGAC AGCTACCTGG TGGAAATCAC CGGCGAACTC 
AAGGCCAGGG GGCACAAGCC CGACGGCACG CCCTGGCGGA TCGCCATCGA GGCACCCCAT 
GACAACGAAC GGGTCGCGCA GCGGATCATC GCCCTCGACG GCTATGCGGT TTCCACATCG 
GGAGACTACC GCAATTTCTT CGAGCAGAAT GGCAAGCGCT ATTCCCATAC GGTGGACCCC 
AGGCTCGGCG CACCGGTCGC CCACCGGCTG GCCGCGGTGA CGGTCGTGGA CCCTTCGGCT 
CTCCGGGCGG ACGGTCTGTC CACTGTCCTG ATGGTGCTCG GCGAGGAACG CGGCCTGGCT 
TTCGCGGAGC AGCGGGGTAT CGCCGCCTTT CTGGTGATTC GTGACGGGCA GGCGTTCGTC 
ACCAAAAGTA CGGCAACCTT CGACCGACTG TTCGGCAAGG GAGACAAGCA ATGA

Protein sequence

MLKPAIVAAL AATMAGCMFS EQVESFVGPT MGSTYSVKYV QRRGTPAKEE LQRETEAILA 
DLDRQVSTYR SDSDIERFNT LPTGSCAAVP DEVRTLVAAG ERLSVESEGA LDLTVGPLLD 
LWGFGPHGHG EQVPDAEAIA AARQRVGHQY LRIDGERLCK DAPVQVDFNS IAAGHAVDRV 
AARFEALGVD SYLVEITGEL KARGHKPDGT PWRIAIEAPH DNERVAQRII ALDGYAVSTS 
GDYRNFFEQN GKRYSHTVDP RLGAPVAHRL AAVTVVDPSA LRADGLSTVL MVLGEERGLA 
FAEQRGIAAF LVIRDGQAFV TKSTATFDRL FGKGDKQ