Gene Avin_20770 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_20770
Symbol
ID	7761002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	2068901
End bp	2070034
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	58%
IMG OID	643804972
Product	Squalene/phytoene synthase
Protein accession	YP_002799253
Protein GI	226944180
COG category	[I] Lipid transport and metabolism
COG ID	[COG1562] Phytoene/squalene synthetase
TIGRFAM ID	[TIGR01559] farnesyl-diphosphate farnesyltransferase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00645323
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTGAAT CCCAAACAGC TCTAGCTATC GAGTCCTCAA CAACCAGTGC CGATGCTTAT 
CAAAACGCTA TCCTTTCAAA AGTCTCCAGA ACTTTCGCAC TGACCATTCC CCAATTGCCG 
CCGCTATTAC GCCGTGCGGT GACCAATGCT TATCTGTTGT GTCGCATCGC AGATACCATC 
GAGGATGAAC CGGCGTTTTC CGCCGAGGAA AAGCGTCGTT ACGAGGATGC ATTCATCGAT 
GCGGTGACTG GCCGCATCGC ACCGCAATAT TTCTCGACCG AACTGGCGTC ACGATTCTCC 
ACGGAAACCT CGGAAGCCGA GCGTGACCTG GTGAGCCAAT TGCCGTTGGT GTTACAGGTT 
ACCAATAGCT TGAAGCCGGC ACAGCGCATG GCGATCGTCA ATTGCCTGAA AGTGATGTCC 
CACGGCATGC ACGACTTCCA GCGCAACGTA GGCCAGCATG GACTGGAAAC GCTGTGCGAC 
ATGGATTGCT ACTGCTACTG CGTAGCCGGC GTAGTGGGCG AAATGCTGAC GGAACTGCTC 
ATCGATTTCG ATCCCGCCCT GGCCAGCCAG CGTGACCCTC TGATGCGTCT GGCGATCTCT 
TTCGGCCAAG GGCTGCAGAT GACCAACATC CTCAAGGATC AGTGGGAAGA TTACCGCCGT 
GGCGTCTGCT GGCTGCCGCA GGACGTCTTC GCCCGATATG GCGTGCGATT GGAGGAGTTG 
CAAGCGGGCC GGCAGGATGC GAACTATATG AGCGCACTGA CCGAGCTCAT CGGGGTGGCT 
CACGCCCACC TGCGCGACGC GTTGGAATAT ACGCTGATGA TTCCGAACAG ACACTCCGGG 
TTCCGCCGCT TCTGCTTGTG GAGTATCGGC CTCGCCGTGC TGACACTGCG CAAGCTGCAG 
CAAAACCCCC ATTTCTCCGC CGGCGAGCAA GTGAAGGTAT CGCGCAAGGC GGTAGCCTAC 
ACCATCGCGC TCACGCGACT GACAGGCAAT TACAATACCG GTTTGCGCTG GCTGTTCGCA 
GCATCCGCAC GCAAGCTTCC GTTGACGCCG CTGTCCGCGG AATGGAGCAC CTCTCCCCAC 
CCACACCTTG CCTGGCCGAA GAGCGCCATC TCCTACTTCG CCGAATCGGC CTAG

Protein sequence

MLESQTALAI ESSTTSADAY QNAILSKVSR TFALTIPQLP PLLRRAVTNA YLLCRIADTI 
EDEPAFSAEE KRRYEDAFID AVTGRIAPQY FSTELASRFS TETSEAERDL VSQLPLVLQV 
TNSLKPAQRM AIVNCLKVMS HGMHDFQRNV GQHGLETLCD MDCYCYCVAG VVGEMLTELL 
IDFDPALASQ RDPLMRLAIS FGQGLQMTNI LKDQWEDYRR GVCWLPQDVF ARYGVRLEEL 
QAGRQDANYM SALTELIGVA HAHLRDALEY TLMIPNRHSG FRRFCLWSIG LAVLTLRKLQ 
QNPHFSAGEQ VKVSRKAVAY TIALTRLTGN YNTGLRWLFA ASARKLPLTP LSAEWSTSPH 
PHLAWPKSAI SYFAESA