Gene Avin_34920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_34920
Symbol
ID	7762387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3561944
End bp	3563428
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	67%
IMG OID	643806358
Product	hypothetical protein
Protein accession	YP_002800616
Protein GI	226945543
COG category	[S] Function unknown
COG ID	[COG2326] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.195205
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGAAT CCGCCGAGAT CGGCCACCAG ATCGACAAGG AAAGTTACGA AGCGGCCGTG 
CCGGCGCTGC GCGAGGCACT GCTCGAGGCC CAGTACGAAC TCCGCCAGCA GGCACGTTTC 
CCGGTGTTGG TGCTGATCAG CGGTATCGAG GGCGCCGGCA AGGGCGAGAC GGTCAAGCTG 
CTCAACGAGT GGATGGACCC GCGGCTGATC GAAGTCAGCA CGTTCGACCA GCAGACCGAC 
GAGGAACTGG CGCGCCCACC GGTCTGGCGC TACTGGCGTC AGTTGCCGCC GAAGGGGCGG 
ATCGGCATCT TCTTCGGCAA CTGGTACAGC CAGATGTTGC AGGCGCGGGT GCACGAGCGG 
ATCGACGATG CCCGCCTCGA CCAGGCCATC GACGGCGCCG AGCGCCTGGA GCGGATGCTC 
AGCGACGAAG GTGCGCTGAT CTTCAAGTTC TGGTTCCACC TTTCCAAGAA GCGCATGAAG 
GAGCGCCTGG CGCTTCTCAA GGACGATCCC CTGCACAGTT GGCGGCTGAG TCCGCTGGAC 
TGGCAGCAGT CGAAGACCTA CGGCAAGTTC GTGCGCTACG GCGAGCGGGT GCTGCGGCGC 
AGCAGCCGGG ACTTCGCGCC CTGGTACGTG ATCGAGGGCT CCGATGCCAA TTACCGCAGC 
CTGAGCGTCG GGCGCATTCT CCTCGACGGC CTGCAGGCGG CCCTCGGGCA CCGGGGCCGG 
CCGGCCCACC GCCCGCACGC GGCGCCGCTG GTGTCCAGCG TGGACAACCG TGCCCTGCTG 
GACTCCCTGG ACATGACCCA GGCCCTCGCC AAGCCGGATT ACCAGCGCCT GCTGATCGCC 
GAGCAGGCGC GCCTGGCCCT GCTGATGCGC GACAAACGCA TACGCCGGCA TGCCCTGGTG 
GCGGTGTTCG AGGGCAACGA CGCGGCCGGC AAGGGCAGCT CTATCCGCCG TGTCGCCGCC 
GCCCTGGACC CGCGCCAGTA CCGGATAGCG CAGATCGCCG CGCCGACCGA GGAGGAGCGC 
GCCCAGCCCT ACCTCTGGCG TTTCTGGCGG CATATTCCGC CGCGCGGCAA GTTCACCATC 
TTCGACCGCT CCTGGTACGG ACGTGTGCTG GTGGAGCGGG TCGAGCGCCT GTGCAGCGAG 
GCCGACTGGC TGCGCGCCTA CGGCGAAATC AACGATTTCG AGGAGCAGTT GAACGATGCC 
GGGGTGGTGC TGGTCAAGTT CTGGCTGGCC ATCGACCGGG AGACCCAACT GGTGCGCTTC 
AAGGAGCGCG AAGCGACACC CTTCAAGCGC TTCAAGATCA CCGAGGAAGA CTGGCGCAAC 
CGCGACAAGT GGGAGGACTA CAGCGACGCG GTGGGCGACA TGGTCGACCG CACCAGCAGC 
GAGATCGCCC CCTGGACCCT GGTCGAGGCC AACGACAAGC GCTTCGCCCG GGTGAAGATC 
CTGCGCACCC TCAACGACGC GCTGGAGAAG GCCTTGCGCG GCTGA

Protein sequence

MFESAEIGHQ IDKESYEAAV PALREALLEA QYELRQQARF PVLVLISGIE GAGKGETVKL 
LNEWMDPRLI EVSTFDQQTD EELARPPVWR YWRQLPPKGR IGIFFGNWYS QMLQARVHER 
IDDARLDQAI DGAERLERML SDEGALIFKF WFHLSKKRMK ERLALLKDDP LHSWRLSPLD 
WQQSKTYGKF VRYGERVLRR SSRDFAPWYV IEGSDANYRS LSVGRILLDG LQAALGHRGR 
PAHRPHAAPL VSSVDNRALL DSLDMTQALA KPDYQRLLIA EQARLALLMR DKRIRRHALV 
AVFEGNDAAG KGSSIRRVAA ALDPRQYRIA QIAAPTEEER AQPYLWRFWR HIPPRGKFTI 
FDRSWYGRVL VERVERLCSE ADWLRAYGEI NDFEEQLNDA GVVLVKFWLA IDRETQLVRF 
KEREATPFKR FKITEEDWRN RDKWEDYSDA VGDMVDRTSS EIAPWTLVEA NDKRFARVKI 
LRTLNDALEK ALRG