Gene Avin_20980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_20980
Symbol	cysE3
ID	7761023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	2093069
End bp	2094052
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	67%
IMG OID	643804993
Product	Serine O-acetyltransferase
Protein accession	YP_002799274
Protein GI	226944201
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1045] Serine acetyltransferase
TIGRFAM ID	[TIGR01172] serine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.101703
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAACA AACCCAAGGC CGTCTTCGAC GGCGTCTCGC ATACGCCGGA GGTACCCGCG 
CCCCGGCCGG TGAACTGGCA ACTGGAGCAG ATCGTCGATG AACTGCGTGC CGCTCGCGCC 
GATTGGCGCA AGAACTGCGG CCGGACGCGC GAGCTGGGCA GCCGCGAATT GCCCTCGCGG 
CAGACCGTGG CGGAGATTCT CGCCGCGCTG AGCGGCGCGC TCTTTCCGAT GCGCCTCGGG 
CCCAGCGATC TGCGCGAAGA GAGCGAGGAT TTCTATGTCG GGCACACCCT CGACAGCGCA 
CTGAACGCGC TGCTCGGCCA GGTACGCCTG GAACTGCACT ATGTCGCCCG CCAGTGCGGG 
CAGCGCGAGC CGGATCTGGA GACGCGCGCG GTGCAGATCG TCCGCGAATT CGGCGCCGCC 
TTGCCGGAAA TGCGCCGGCT GCTGGACAGC GACGTGATCG CCGCCTACCA GGGCGATCCG 
GCGGCGCGCA GCCTGGACGA GGTACTGATC TGCTATCCGG GCGTCCAGGC GGTGATCCAC 
CATCGCCTGG CCCATCTTCT GTACCGCTCC GGGGTGCCGC TGCTGGCGCG GATCGTCGCG 
GAGATCGCTC ATTCCGCCAC CGGCATCGAC ATCCATCCGG GAGCGCAGAT CGGTCACAGC 
TTCTTCATCG ACCACGGGAG CGGCGTGGTG ATCGGCGAAA CCGCGGTGAT CGGCAACCGC 
GTACGCATCT ATCAGGCGGT GACCCTGGGC GCCAAGCGCT TCACCGTCGA CGAGTCCGGC 
CAGTTGCTCA AGGGCCAGGC CCGTCATCCT ATCGTCGAAG ACGACGTGGT AATTTATGCC 
GGCGCCACCA TTCTGGGCCG CATCACCATC GGCAAGGGTT CCATCATCGG TGGCAATGTC 
TGGCTGACCC GTAGCGTGCC TCCGGGCAGC AACGTCACCC AGGCGACCTT GCAACATCAG 
CCAGGCAACG CGGGGCAGCC GTGA

Protein sequence

MSNKPKAVFD GVSHTPEVPA PRPVNWQLEQ IVDELRAARA DWRKNCGRTR ELGSRELPSR 
QTVAEILAAL SGALFPMRLG PSDLREESED FYVGHTLDSA LNALLGQVRL ELHYVARQCG 
QREPDLETRA VQIVREFGAA LPEMRRLLDS DVIAAYQGDP AARSLDEVLI CYPGVQAVIH 
HRLAHLLYRS GVPLLARIVA EIAHSATGID IHPGAQIGHS FFIDHGSGVV IGETAVIGNR 
VRIYQAVTLG AKRFTVDESG QLLKGQARHP IVEDDVVIYA GATILGRITI GKGSIIGGNV 
WLTRSVPPGS NVTQATLQHQ PGNAGQP