Gene Avin_29640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_29640
Symbol
ID	7761865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	3061777
End bp	3063606
Gene Length	1830 bp
Protein Length	609 aa
Translation table	11
GC content	66%
IMG OID	643805837
Product	oligopeptide ABC transporter, periplasmic substrate binding protein
Protein accession	YP_002800105
Protein GI	226945032
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.113024
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTCCCC TCTGTCTGCT GTTGCTCAGT CTGCTCGCGA GCGGGCCGGC GATCGCGCGC 
ATCACCGAAA GCCATGGCTA CGCCCAGTTC GGCGTGCTCA AGTATCCCGT CGGTTTCCAG 
CATCTCGACT GGGTCAACCC CGAGGCCCCC AAGGGGGGCA CGCTGCGCCT GATGGCCCTC 
GGCACCTTCG ATACGCTGAA CCCCTACAGC TTCAAGGGAA CCAGCCCGTC GGCAACGGCC 
GACTTCCTGC AGTACGGCAT CAACGAGCTG AACGAGCCGC TGATGGCCGG CTCCGGGGTC 
TACGATCCCT CCGGGGACGA GCCCGCCTCC AGCTATGGCC TGATCGCCGA ATCCGTCGAA 
TACAACGAAA GCCGCAGTTG GGTGGTGTTC AACCTGCGCC AGGCGGCCCG CTTCCATGAC 
GGCAAGCCGA TCACGGCCCA GGACGTGGCC TTCTCCTACC GCCTGCTCAG CCAGGAGGGC 
CATCCCCAGT ACCGCGCCGA GCTGCGCGAG GTGCAGCGGG TCGACGTCCT CGGCCGCCAG 
CGCATCCGCT TCGTCTTCAA GCGCTCGGGC AATCCGCTGC TGATCCTGCG CCTCGGCGAG 
TTGCCGGTGC TCCCCCAGCA CTACTGGAAG AACCGCGACT TCAAGGCCAC CACCTTCGAG 
CCGCCCCTGG GCAGCGGCCC CTACCGCATC GTTCAGGTGC AGCCGGGGCG CCGCCTGGTG 
TTCGAGCGGG TGAAGAACTG GTGGGGCGCC AAGCTGCCGA TCAACCGCGG CAAGTACAAC 
TTCGACCGGG TGGATGTGGA CTTCTACCGC GACAGCGGCG TCGCCTTCGA GGCGTTCAAG 
GCCGGGCAGT TCGACTTCTA TATCGAGCAC CAGGCGAAGA ACTGGGCCGG GGGCTACCAT 
TTTCCGGCCG TACAGGCGGG CCAGGTGATC CACGCCGAGA TCCCGCACCG GATTCCGACC 
CAGACCCAGG CGCTGTTCAT GAACACCCGC CGCAGCACCT TCGCCGATGC CAGGGTGCGC 
GAGGCCCTGG GGCTGATGTT CGATTTCGAA TGGACCAATC GCGCCCTGTT CTACGGCGCC 
TACCGGCGCG CCGAGAGCTA CTACCCGAAC AGCGAGTTTT CCGCCGCCGG CAAGCCGGAG 
GGGGAAGAGT GGCTGCTACT TTCCAGGTAT CGCCAGCAAT TGCCCGAGCG CCTGTTCCGC 
GAGCCTTTCC CGATGCCGAA GACCGACGGC CACGGCATCC CGCGCGAAAC CCTGCGCCGC 
GCCCTGGCCC TGCTCGGCGC GGCCGGCTGG AAGCTCTCCG GCCAGCGACT GGTCGATGCC 
CGCGGCCAGC CGCTGCGCTT CGAGATCCTG CTGGTCAATC CCAGCCTGGA GCGCATTCTC 
CAGCCCTACA GCGAAAACCT CGCCGGCATC GGCATCGAGG CGCAGTTGCG TACCGTGGAT 
CGCGCCCAGT ACAAGCAGCG GCTGGACCAT TTCGACTACG ACATGATCCT GCTGACCCTG 
CCGCAGACCC TCAGCCCCGG CCTCGAGCAG TGGTTCTACT TCCACTCCAG CCAGATTGGC 
GTGAAGGGCG GCAAGAACTA CGCGGGCATC GCCAACCCGG TGGTCGACGG CCTGCTGGAG 
AGCCTGCTGG CGGCACAGAC CCGGGAACAG CAGGTCGCCG CCGTCCGCGC CCTGGATCGC 
GTCCTGCTCT GGCAGCACTA CAGCATCCCC AACTGGTACA TCAATCATCA CCGCCTGGCG 
TACCGCAACC GGTTCGCCTT CGTCGCCACG CCCCCCTACA CGCTGGGCCT GCGCGCCTGG 
TGGCTGAAGA CCAAGGAGAA CGACCGATGA

Protein sequence

MRPLCLLLLS LLASGPAIAR ITESHGYAQF GVLKYPVGFQ HLDWVNPEAP KGGTLRLMAL 
GTFDTLNPYS FKGTSPSATA DFLQYGINEL NEPLMAGSGV YDPSGDEPAS SYGLIAESVE 
YNESRSWVVF NLRQAARFHD GKPITAQDVA FSYRLLSQEG HPQYRAELRE VQRVDVLGRQ 
RIRFVFKRSG NPLLILRLGE LPVLPQHYWK NRDFKATTFE PPLGSGPYRI VQVQPGRRLV 
FERVKNWWGA KLPINRGKYN FDRVDVDFYR DSGVAFEAFK AGQFDFYIEH QAKNWAGGYH 
FPAVQAGQVI HAEIPHRIPT QTQALFMNTR RSTFADARVR EALGLMFDFE WTNRALFYGA 
YRRAESYYPN SEFSAAGKPE GEEWLLLSRY RQQLPERLFR EPFPMPKTDG HGIPRETLRR 
ALALLGAAGW KLSGQRLVDA RGQPLRFEIL LVNPSLERIL QPYSENLAGI GIEAQLRTVD 
RAQYKQRLDH FDYDMILLTL PQTLSPGLEQ WFYFHSSQIG VKGGKNYAGI ANPVVDGLLE 
SLLAAQTREQ QVAAVRALDR VLLWQHYSIP NWYINHHRLA YRNRFAFVAT PPYTLGLRAW 
WLKTKENDR