Gene Avin_01780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_01780
Symbol
ID	7759140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	166855
End bp	168561
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	67%
IMG OID	643803099
Product	Na/Pi cotransporter II protein
Protein accession	YP_002797415
Protein GI	226942342
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1283] Na+/phosphate symporter
TIGRFAM ID	[TIGR00704] Na/Pi-cotransporter [TIGR01013] Phosphate:Na+ Symporter (PNaS) Family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAACGC TGCTTCACCT GCTGTCAGCC ATCGCCCTGC TCGTGTGGGG CACACATATC 
GTTCGTACCG GCATCCTGCG CGTCTATGGC CTGCAACTGC GCCAGTTGCT CAGCCACAGC 
ATGCGCCGGC CATCCCTGGC TTTCCTCAGC GGCATGGGCG TCACCGCACT GGTGCAAAGC 
AGTAACGCCA CCGCCATGCT GGCCAGTGCC TTCGTCGCCG AGGGGCTGAT GGCGCTGACT 
CCGGCACTGG CAGCCATGCT GGGTGCGGAT GTCGGCACGG CCGTGATGGC GCGGGTGCTG 
ACCCTGGATC TATCCTGGCT GTCGCCGCTG CTGCTGCTGT GCGGCGTCAG CCTGTTCCTC 
GCCCAGAAGA GGAACCGTGC CGGCCAGCTC GGCCGGGTGG CGATCGGCCT CGGCCTGATC 
ATGCTCGCCC TCGAACTGAT CGTCGTGGCC AGCGAACCCA TCACCCATGC CCAAGGACTG 
GGCCTGTTGT TCGCCTCGCT GACCGGCGAC CCGCTGCTGG CCGCGGTGAT CGGCGCTCTG 
TTCGCCATGC TCACCTATTC CAGCCTGGCC ACGGTGCTGC TCACCGCCAC CCTGGCCGGT 
GCCGGACCGA TCGACCTGCC GCAGGCCATC GGCCTGGTGA TCGGCGCCAA CATCGGCAGC 
GGCATGCTGG CCTACCTCAA CAGCAGCCTG CATGCCGCTG CCGGCCGACG GGTCGCCCTC 
GGCAACCTGC TGTACAAGCT GCTCGGACTG CTGGTGCTAC CGCTGCTCGA TCCGCTGACG 
GCCTGGATGC GAACGCTGCC GCTCAGCCTG CAGGACCAGG TGATCGGTTT CCACCTGGCC 
TACAACAGCC TGCGCTGCCT GCTGCTGCTA CCCAGCGTCG CGCCGATGGC GCACCTGTGC 
ACCCGGCTGC TGCCGGAGCG GATGACGGAA AGAAACGGTA CGGCCCAGCC GCGCTATCTC 
GATCCGGAGG CCCTGCCGAC GCCGACCCTG GCGCTGGCCA ATGCGGTACG CGAAACCCTG 
CGTATCGGCG ATCTGGTCGA ACAGATGCTC GGTCATCTAC AGGATGTGCT GCTGGGACAC 
CGGGCCGAGG CGGGCCGCGA GATCCGCCGC CTCGAAGACG AGCTGGACAG GCTCTACGGA 
GCGGTGAAGC TGTACCTGGC CAAGTTGCCG CGCCAATCGC TGGGCGACGC GGAAGACCGC 
CGCTGGGCGG AGATCATCGA ACTGGCGGTC AATCTGCGCC AGGCCGGCTA CATCCTCGCC 
AAGATGCAGC ACAGGGCCGA GCGGCGGAGC GTCACCCGTC CCGATCAGGA AGAGCTGACG 
GAGCTGCATG GCGAACTTCT GGCCAATCTG CGCCTGGGAC TGAGCGTGTT CCTTTCCGGC 
GACTCGCGCA GCGCGCGCCA ACTGCTGCGC CAGAAACGCC GTTTCCGCGC CCTGGAACGC 
CATCTGGCGC ATGCCCATGT CGATCGCCTG CATCGCCAGC CTCTGCACAG TGCCGAAGTC 
GGCTCGGCTC ATCTGGAGTT GCTGGAAGAC ATGAAGCGCC TCAATTCGCT GTTCTGCTGC 
AGCGCCTATG TGGTGCTGGA GGCCGAGGCC CAGAACACCG ACTACCCGGA CGAAAGGCCC 
GGACACGGCC GACAGGACGA CGAACTGCGC CGTCTGTTGA TCGACGATGC GGCGAACAGA 
CCGGCGGGAG GCTCGGCGGC GGGCTGA

Protein sequence

MLTLLHLLSA IALLVWGTHI VRTGILRVYG LQLRQLLSHS MRRPSLAFLS GMGVTALVQS 
SNATAMLASA FVAEGLMALT PALAAMLGAD VGTAVMARVL TLDLSWLSPL LLLCGVSLFL 
AQKRNRAGQL GRVAIGLGLI MLALELIVVA SEPITHAQGL GLLFASLTGD PLLAAVIGAL 
FAMLTYSSLA TVLLTATLAG AGPIDLPQAI GLVIGANIGS GMLAYLNSSL HAAAGRRVAL 
GNLLYKLLGL LVLPLLDPLT AWMRTLPLSL QDQVIGFHLA YNSLRCLLLL PSVAPMAHLC 
TRLLPERMTE RNGTAQPRYL DPEALPTPTL ALANAVRETL RIGDLVEQML GHLQDVLLGH 
RAEAGREIRR LEDELDRLYG AVKLYLAKLP RQSLGDAEDR RWAEIIELAV NLRQAGYILA 
KMQHRAERRS VTRPDQEELT ELHGELLANL RLGLSVFLSG DSRSARQLLR QKRRFRALER 
HLAHAHVDRL HRQPLHSAEV GSAHLELLED MKRLNSLFCC SAYVVLEAEA QNTDYPDERP 
GHGRQDDELR RLLIDDAANR PAGGSAAG