Gene Avin_14960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_14960
Symbol
ID	7760431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	1475291
End bp	1476367
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	67%
IMG OID	643804393
Product	hypothetical protein
Protein accession	YP_002798686
Protein GI	226943613
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAAAAT GGCTGCTGCT GCTGGAAAGT GGCCTGCTGG TGGGGGGACT GCTCCTGTCG 
TCCGCCGTCT GGCAGCAGAG GGCCGCGCTC GAACAGCCTC TGAGGCTCGC CGAGGAGCGT 
CTGCTGGAGG TTCCGAGCGG TGCCACGCCC GGCGGTCTGC TCAATCGTCT GCAGGACGAG 
GGACTGTTGC ACGGGAGCTT CTGGCTGCGC CTGTACTGGC GCTTCAATCT GTCCGAGCAG 
GGTATGCGCA GCGGCGAATA TCGCCTGGAG CCAGGCATGA CGGCCGCCGA ACTGCTCGAA 
CTCTGGCAGC GTGGCGAGGT GGTGCAGTAC AACCTCACTT TGGTGGAGGG CTGGAGCTTC 
CGTCAGGTTC GGGCCGCATT GGCCCGGACC GACAAACTGG AGCAGTCCCT GGAAGGGGTT 
TCCGATGCCG AGCTGATGGC TCGGCTGGGT CAGCCGGACG CCCACCCGGA GGGGCGCTTC 
TTCCCCGATA CCTACCGCTA TGTGCGCGGC ATGAGCGACT TCGAGCTGCT CAGGCAGGCC 
CATGCCCGCC TGCAGCAGGT GCTCGCCGAG GAATGGGCCG GGCGGTCGCC GGACCTGCCC 
TACGCGACGC CCTACGAGGC GCTGATCATG GCCTCGATCG TCGAGAAGGA AACCGGCATT 
CCCCGCGAAC GCGAGCAGAT CGCCGGCGTG TTCGTGCGGC GCCTGGAACA GGGCATGCTG 
CTGCAGACCG ATCCGACGGT CATCTATGGC CTGGGCGAGC GCTACAACGG CAAGCTCGGG 
CGCGCCGAGC TGCTCGCGAC CACGCCCTAC AACACCTATG TCCAGCCCGG CCTGCCACCG 
ACGCCGATCG CCCTGCCGGG ACGCGAGGCG ATCCATGCGG CGCTGCATCC GGCGGAGGGC 
CGCGAGCTGT ATTTTGTCGC CCGCGGCGAT GGTAGCCATA TCTTTTCCGA AACCCTGGAG 
GCGCACAACC AGGCGGTGCG CGAGTACCAG CTCAAGCGCC GCACCGACTA CCGCTCCAGC 
CCATCGTCCG AGGCGGTGGA GCGTTCCGAG CGGCAAGACG ACGAGGAAAA CCCGTGA

Protein sequence

MRKWLLLLES GLLVGGLLLS SAVWQQRAAL EQPLRLAEER LLEVPSGATP GGLLNRLQDE 
GLLHGSFWLR LYWRFNLSEQ GMRSGEYRLE PGMTAAELLE LWQRGEVVQY NLTLVEGWSF 
RQVRAALART DKLEQSLEGV SDAELMARLG QPDAHPEGRF FPDTYRYVRG MSDFELLRQA 
HARLQQVLAE EWAGRSPDLP YATPYEALIM ASIVEKETGI PREREQIAGV FVRRLEQGML 
LQTDPTVIYG LGERYNGKLG RAELLATTPY NTYVQPGLPP TPIALPGREA IHAALHPAEG 
RELYFVARGD GSHIFSETLE AHNQAVREYQ LKRRTDYRSS PSSEAVERSE RQDDEENP