Gene Avin_31080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_31080
Symbol
ID	7762008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3213431
End bp	3214741
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	69%
IMG OID	643805983
Product	hypothetical protein
Protein accession	YP_002800247
Protein GI	226945174
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACGA TAACCCTGCA GGTTTACCTG GACGGCCAAT GGCACGATGC GATGCGGGTG 
AGCTTCGATG CTCCCGAAGA CGGGTTGCGC AGTCGTTGCA GCGCTCGCTA CGAGGCCGAC 
TATCTCGTCG CCCACCTCGA CGAACTGGGC ACGCCGAAGG CAGCGGCCGT GAGCGCAGTT 
TTTTCCCTCG GCTGGGAAGA CTATCGCGGC ATCGCTCCGG CCTTCCTGCA CGACATCGTT 
CCCGCCGGCG CCGCGCGCCG GCACATCCTG GCACGGATGG CCGTGCCGCT CGGCGCACCG 
GAGGAGTTCT TCCTGCTGCA GCACTGCACC ATGGCGCCCG TCGGTAACCT GCGCGTCAAG 
GAGTCCGTCG CCGCCCCGCG CGAGCCGGTC GGCTTCCCTC GCGAGGAGGT GATCCGCCGC 
GATATCCGTT TTCTCGACCA TGCCTACGAG CGCGGTGCAG CCATCGGCGG CGCCACCGGG 
GCCGGCGGCG AGGCGCCCAA GCTGCTGCTC GCCGAAGACG CCGCCGGCAA CCTCCATCCG 
GACGCCGGCC TGCCCGATGC CGAGGTGTGC CGGCACTGGT TCGTCAAGTT CCCGTGCAAT 
TCGGGGACGG AAACCGACCG GGTCATCCTG CGCAGCGAAT ACTGCTATTA CCGCGCGCTG 
AACCGGCTGG GAATCGAGAC GATCTCCGCC GAAGGGCTGG CCTACGAGGA AGCGGAAAAG 
CCCAGCCTGT GGATGCGGCG CTTCGACCGC CGGATCGGCC CGAACGGCGT CGAGCGCATC 
GCCGTCGAGT CCGCCTATTC CCTGTGCGGC GTGACCCGGC CGGGCAGCCG CATGGAGCAT 
GTCGAGGTCG TCGCCCGCCT GGCGGAAACC TGGGACGCCG CCGGGCAGGC TGCGGAAATT 
CCCGCCATGG TCGCCGAGTA TCTGCGCCGC GACCTGCTCA ACCAGATCCT CGGCAACACC 
GACAACCACG GGCGTAACCT TTCCATCCTG CGCACGCGCG AGCGCATCGA CCTGGCGCCG 
ATCTACGACC TCGCACCGAT GGCGATGGAC CCCGAAGGCG TGGTGCGCAC GACTCGCTGG 
CCCGAGGGCA TCGAGCGGTT CGACGGCACC GACTGGCGGG CCGCCTGCAA CGCCCTGTCG 
CGCTGGAGCG ACCCCGAACT CCTGTTCGAG CGCTTGCGCG ACGACGCCCG CCAACTGCTG 
GCGCTGCCGG ACCTGCTGGC CGAACTGAGC CTGCCCGAAC AGACCTGGAA GGCACCGACC 
ATCCCGCTGG GCCGCCTGGA GGTCACCTTG CGCCTCTGGG GACTGCTGTG A

Protein sequence

METITLQVYL DGQWHDAMRV SFDAPEDGLR SRCSARYEAD YLVAHLDELG TPKAAAVSAV 
FSLGWEDYRG IAPAFLHDIV PAGAARRHIL ARMAVPLGAP EEFFLLQHCT MAPVGNLRVK 
ESVAAPREPV GFPREEVIRR DIRFLDHAYE RGAAIGGATG AGGEAPKLLL AEDAAGNLHP 
DAGLPDAEVC RHWFVKFPCN SGTETDRVIL RSEYCYYRAL NRLGIETISA EGLAYEEAEK 
PSLWMRRFDR RIGPNGVERI AVESAYSLCG VTRPGSRMEH VEVVARLAET WDAAGQAAEI 
PAMVAEYLRR DLLNQILGNT DNHGRNLSIL RTRERIDLAP IYDLAPMAMD PEGVVRTTRW 
PEGIERFDGT DWRAACNALS RWSDPELLFE RLRDDARQLL ALPDLLAELS LPEQTWKAPT 
IPLGRLEVTL RLWGLL