Gene Avin_39120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_39120
Symbol
ID	7762801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3962913
End bp	3964157
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	75%
IMG OID	643806775
Product	hypothetical protein
Protein accession	YP_002801027
Protein GI	226945954
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00513866
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAAAT CCAGGCTCTT GCGTCTTTCC CTGCCGTTGC TCGTCGGCGC CGTGCTGGCC 
GCCTGCGCCG GGCGCCCCGA GCCGCCCGGT CCGCCGCCCG GTGAAAACCT CGAGCGTCGA 
CTGGAGGGCG CCTACCGGCC GGCCGCGCGG TCGCCGGTGC GCGGCTGGGA TGACGAATGG 
CAGGTGGCCG GACAGGCGGT GGAGGTCAGT TGGCTGGCGC CGGAACAGGT CCAGGGGATG 
CCGCTGATCC TCTATCTGCC GGGGCTCGGC GAGAGCAGCC GGGACGGTGT GCAATGGCGC 
CGGGCCTGGG CCGAGGCCGG CTACGCGGTG CTTTCGGTAC AACCTCGGCA GTACGGACGG 
GTGATCTACT CCAGCTCCGA GGCGCAGGTG GGGGTATTCC GCTCCCTGGC GCAGAAGAGC 
TTCGCTGACC AGGCCCTGGC GGCGCGCATC GCCGTGCTCG ATCAGGTCCT GGCGGATCTG 
CGCAGACGGG CGCAAGCCGG CGAGCCGAAC CTGGCCAGGG TCGACTGGCA GCGGCTGGCG 
GTGGCCGGCT TCGATCTCGG CGCGCAGACC GCCGCCGCCC TGGCCGGCGA GCGCGCGGCC 
GGAGCATCGG CGCCGGCCGG CTGGCAGCCG AGGGCGGCGA TCCTGCTCAG TCCCTATGTC 
GCCGAGGACG GCGGGGGCGA CCGCTTTGGC CGCATCGGTA CGCCGCTGCT GGCGGTCACC 
GGGCCGCACG ACGAGGACCC TTTCGGCTGG GTCGACCCGC CGAGCCGCCG CCAGCGGCTC 
TGGGAGGGGG TGAGGACCTC CGGCAGCTAT CAACTGATCG CCGCCGAGGC CAGTCATCGG 
CTGCTGAGTG GCTCGTTCGA GGACATGGCC GGAGCGGGCG GCGGGCGTCA GGGCGGACCT 
TCGTCCGGCG GCCGGCCGGA GGGGGGCGCT GGTCGTGGCG GAAGCGGCGG GCCTGGCGGC 
GGTGGGGGAC CCGGTGGGGG CGGCGGGCCC GGTGGCGGTC CTGCAGGCGG CGGACGCGCC 
GGTGGTCCCG GCGGCAAGGG CGGCGGCCCC GGTGGCGGCA GTCGGATGGG CCGCGGCCAA 
GGCATGGAGG AACGCATCGA TCCGCGCCAG ATGGCCAGCC TGCAGAGCCT CAGCCTGGCC 
TTCCTCGACG CCCGGGTGCG CGATGCCGCG CCGGCGCGCC TGTGGCTGGA ACGCGACGCC 
GTCCAGTGGC TGGAGGCGAC CGGCCGGCTC GAGCGGAAAC CCTAA

Protein sequence

MSKSRLLRLS LPLLVGAVLA ACAGRPEPPG PPPGENLERR LEGAYRPAAR SPVRGWDDEW 
QVAGQAVEVS WLAPEQVQGM PLILYLPGLG ESSRDGVQWR RAWAEAGYAV LSVQPRQYGR 
VIYSSSEAQV GVFRSLAQKS FADQALAARI AVLDQVLADL RRRAQAGEPN LARVDWQRLA 
VAGFDLGAQT AAALAGERAA GASAPAGWQP RAAILLSPYV AEDGGGDRFG RIGTPLLAVT 
GPHDEDPFGW VDPPSRRQRL WEGVRTSGSY QLIAAEASHR LLSGSFEDMA GAGGGRQGGP 
SSGGRPEGGA GRGGSGGPGG GGGPGGGGGP GGGPAGGGRA GGPGGKGGGP GGGSRMGRGQ 
GMEERIDPRQ MASLQSLSLA FLDARVRDAA PARLWLERDA VQWLEATGRL ERKP