Gene Avin_06990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_06990
Symbol
ID	7759652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	664297
End bp	665346
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	68%
IMG OID	643803620
Product	hypothetical protein
Protein accession	YP_002797924
Protein GI	226942851
COG category	[S] Function unknown
COG ID	[COG5345] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.481755
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGGACT GGAAAGAAAG CGCAAGCCGT GCGTACGGTG GGGCCGACAG CGCCCTGCGG 
CGCATCGTCG GCAACCACTG GCTGGGGCGC GCCCTGGCGC TGTTGCTCGC CCTCTACCTG 
CTGGTGACCG GATTGCTGGG CTGGTTCTGG AGCCTGGAGC CGGATGCCTT CCCGGTGCAG 
GAGAACGCCC AGGCCTCGGC CGAGCAGGCG CAGCGCAAGT TCGTCAAGGG CTACACCACC 
GTCGAGACCC TGCGGACCGT GGCCGGTACC CTGCTCGACA AGCCGGGCGG CTACCTGACC 
AACGACCTGT CCCCGCCCGG CATCTGGCTG GACAACATGC CCAGTTGGGA ATTCGGCGTG 
CTGACCCAGG TGCGCGACCT GGCGCGCTCG CTGCGCAAGG AAATGGCCCG TTCGCAGTCG 
CAGTCCACCG AAGACCCGGA TCTGGCCAAG GCCGAGCCGC GCTTCAACTT CGACAACCGT 
AGCTGGGCGC TGCCGGCCTC CGAAACCGAA TACCGCGCCG GTCTCAAGCT GCTCGACAGC 
TATCTGGCGC GCCTGGCCGA CCCGGTCAAG CCCAGCGCGC AGTTCTTCGC CCGCGCCGAC 
AACCTGAATG GCTGGCTGGG CGACGTCGCC ACCCGTCTCG GCTCGCTCTC CCAGCGGCTC 
TCGGCGAGCA TCGGCCAGGA GCGCCTGGAT GCCGACCTGG TGCCCGACGA GGAGACCGGC 
CAGGTACAGC AGGGCGAAGT CGTCAAGACG CCCTGGCTGC AGATCGACAA CGTGTTCTAC 
GAGGCGCGCG GCCAGGCTTG GGCGCTGGCG CATTTCCTGC GCGCCATCGA GGTGGACTTC 
GGCGACGTGC TGGCGCGCAA GAACGCCACC GTCAGCCTCC AGCAGATCAT CCGCGAGCTG 
GAAGCGGCGC AGGAGCCGCT GTGGAGCCCG ATGGTGCTGA ACGGCGGCGG CTACGGCATG 
CTGGCCAACC ACTCGCTGGT GATGGCTAAC TTCATCTCCC GGGCCAATGC CGCGCTGATC 
GACCTGCGCG CGCTGCTTTC CCAGGGCTGA

Protein sequence

MLDWKESASR AYGGADSALR RIVGNHWLGR ALALLLALYL LVTGLLGWFW SLEPDAFPVQ 
ENAQASAEQA QRKFVKGYTT VETLRTVAGT LLDKPGGYLT NDLSPPGIWL DNMPSWEFGV 
LTQVRDLARS LRKEMARSQS QSTEDPDLAK AEPRFNFDNR SWALPASETE YRAGLKLLDS 
YLARLADPVK PSAQFFARAD NLNGWLGDVA TRLGSLSQRL SASIGQERLD ADLVPDEETG 
QVQQGEVVKT PWLQIDNVFY EARGQAWALA HFLRAIEVDF GDVLARKNAT VSLQQIIREL 
EAAQEPLWSP MVLNGGGYGM LANHSLVMAN FISRANAALI DLRALLSQG