Gene Avin_04780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_04780
Symbol
ID	7759435
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	450447
End bp	451595
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	68%
IMG OID	643803399
Product	ABC transporter protein
Protein accession	YP_002797707
Protein GI	226942634
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0767] ABC-type transport system involved in resistance to organic solvents, permease component
TIGRFAM ID	[TIGR00056] conserved hypothetical integral membrane protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0570805
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATCCGA CCCCCTCATC ACCAGGTCAA CTGCAACCGA GCAGTGCCGG CCAGCCTCCC 
GGGCTGAACG TCGTCGGCGA CTGGACGTTG CAGCACTATC CACGCCTGAA ACGCGAAATC 
GAGCGCGCCA GGCCGCGGCT CGACGACGCC TGCCCGGTCG TGCTGGACGG CCTGGGCGCG 
CTCGACACCG CGGGCGCCGG CCTGCTCGTG GAGTTGCTCG GCGCCCGGCG CCTGACGGAC 
ATCGCCCGCT GGGCGCCGCA ACTGCCGGCC GAGCGCCAGG CCCTGCTGCG CACGGTCGCC 
ATGGCGGTCG CCGGCGCCGC CGGTACCGAG GAGGAGCCGG AACGCTCCAC CCTCAAGGAC 
GAGCTGGCGC ACATCGGCCG GGTCGTCGAG ACGCTCTGGG AACAGCAGCG CACGCTGTAC 
GGCTTCATCG GCCTGACTCT GAGCACCCTG CTGGCGACCC TGCCGCGCCC GCGACGCTGG 
CGCATCACTC CGCTGGTGGC GCACATCGAG CGGACCGGGC TGGACGCCGT GCCCATCGTC 
GCCCTGCTGA CTTTCATGGT CGGCGCGGTG GTGGCCTTCC TCGGCGCCAC CGTGCTCGGC 
CAGTTCGGCG CCACCATCTA TACCGTCAAC CTGGTGGCCT ATTCCTTCCT GCGCGAATTC 
GGCGTGCTGC TCTGCGCCAT TCTGATGGCG GGACGCACCG CCAGCGCCTT CGCCGCGCAG 
ATCGGCGCGA TGAAGGCCAA CGAGGAAATC GACGCGATCC GCGCCCTCGG CCTCGATCCG 
ATCGAGTTGC TGGTGCTGCC GCGGGTGCTG GCGATGCTGC TGACCCTACC GATCCTCACC 
TTCATCGCCA TGCTCTGCGG CATCCTCGGC GGCCTGGCGG TCTGCGTCCT GGCGCTGGAC 
ATCTCGCCGG TGCAGTACTT CGCCATCCTC GAACAGGAAA TTCCGGTCAA CCATTATCTG 
GTCGGCCTCG GCAAGGCGCC GCTGTTCGCC TTCCTGATCG CCGTGATCGG TTGCCTGGAG 
GGCTTCAAGG CCAGCGGCAG CGCCCAGTCG GTCGGCGAAC GCACCACCTC CAGCGTGGTA 
CAGTCGATCT TCATGGTAAT CCTGATCGAC GCCCTGGCCG CCCTGTTCCT CATGGAGATG 
GGCTGGTGA

Protein sequence

MYPTPSSPGQ LQPSSAGQPP GLNVVGDWTL QHYPRLKREI ERARPRLDDA CPVVLDGLGA 
LDTAGAGLLV ELLGARRLTD IARWAPQLPA ERQALLRTVA MAVAGAAGTE EEPERSTLKD 
ELAHIGRVVE TLWEQQRTLY GFIGLTLSTL LATLPRPRRW RITPLVAHIE RTGLDAVPIV 
ALLTFMVGAV VAFLGATVLG QFGATIYTVN LVAYSFLREF GVLLCAILMA GRTASAFAAQ 
IGAMKANEEI DAIRALGLDP IELLVLPRVL AMLLTLPILT FIAMLCGILG GLAVCVLALD 
ISPVQYFAIL EQEIPVNHYL VGLGKAPLFA FLIAVIGCLE GFKASGSAQS VGERTTSSVV 
QSIFMVILID ALAALFLMEM GW