Gene Avin_29390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_29390
Symbol
ID	7761841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	3029896
End bp	3030966
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	65%
IMG OID	643805813
Product	ABC-type nitrate/sulfonate/bicarbonate transport system,substrate binding component
Protein accession	YP_002800081
Protein GI	226945008
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAATC ATCGATCCGC CCATACAAGA AAGGCTCTGC TTCCTTCCGT TTTGCGCAGC 
GCGCTTGTCC TGTTGTGTTT CACGCCCCTG TTCGCCCACG CCGCGGACGT GGATGCGTCC 
CGGCTGCCGG AAAGCATCCC CGAAGGTACG CGGTTGGTCT TCGGCGACCA GAACGAGAAG 
GTGCAGACGC TGCTGAAAGC CTCGGGCCAT GAGGAGAAAC TCGGGTTCGA AATCGAATAC 
GCCAACTTCA GGGGCGGGCC GGCGATTCTG GAAGCCTTCC GGGCCGGCGC CCTGGACATC 
GCCACGGTCG GCAGCACGCC GCCGATCCAG GCCCAGGTGG CGGGCGAGGA CCTGCCCATC 
GTCGCCGCCG CGCAAAGCAG CGAGCCGGCC TACGGACTGG CCGTCAGCCC CGGCGCGAAG 
GTGACCTCGC TCAAGGCGCT GAAAGGCACG AAAATCGCCT ACGCCGAAGG CACCGCCCGC 
CAACCGTTCG TCCTCAAGGC GCTGCGCGAG GGCGGGCTGG GCAGAAAGGA TGTCACGCTG 
GTTCCATTGC GCGTGGACGA TTTCGTCGAT GCGCTGCGCA CTGGACAGGT CGACGTCGCC 
GCACTCACCG AGCCGCACTT CTCCCGCTAT ATCGGCGAAG GACCCGACCG ACAGGAGCGG 
CACATCCCGT TCGGCGAACA CGCGGTATTG CCCAGGGAGC TGACGTTTCT CTACGCCAGC 
GCCAAGTCGC TGAAAGACGA AGCCAAGGCC GCTGCCATCG TCTCGCTGGT CAAGCACTGG 
ATCGCGGCCA ACCAGTGGGC CGAGGCGCAT CCGGAAGACT GGGCCAAGGC CTTCTACGTC 
GACCGGCACG GCCTGAGCCC GCAGGAGGCG CTGCGCATCA TCGCCGCTCA GGGCAAGGTT 
CGCTTTCCCG CGCTCGAGGA TCTGATCGCC GGGCAGCAGG CCGATATCGA TCTGCTTCAT 
GAAGTGGGAG ACATCCCCTC CCGGCTGGAT GCGCGCGACG AATTCGATCT GCGCTTCGAC 
CCGGTGATCG CCCGCAGCCT GAAAGCCGAG GAAACCGCCG ATGTCCGCTG A

Protein sequence

MNNHRSAHTR KALLPSVLRS ALVLLCFTPL FAHAADVDAS RLPESIPEGT RLVFGDQNEK 
VQTLLKASGH EEKLGFEIEY ANFRGGPAIL EAFRAGALDI ATVGSTPPIQ AQVAGEDLPI 
VAAAQSSEPA YGLAVSPGAK VTSLKALKGT KIAYAEGTAR QPFVLKALRE GGLGRKDVTL 
VPLRVDDFVD ALRTGQVDVA ALTEPHFSRY IGEGPDRQER HIPFGEHAVL PRELTFLYAS 
AKSLKDEAKA AAIVSLVKHW IAANQWAEAH PEDWAKAFYV DRHGLSPQEA LRIIAAQGKV 
RFPALEDLIA GQQADIDLLH EVGDIPSRLD ARDEFDLRFD PVIARSLKAE ETADVR