Gene Ava_2909 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_2909
Symbol
ID	3681414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	3615524
End bp	3616864
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	44%
IMG OID	637718254
Product	polysaccharide export protein
Protein accession	YP_323415
Protein GI	75909119
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.723004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000339784
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTAATAG TTTTCAATGA TTATATGCGT GCATTCTGCG CTTTATCCCT TGTAAGTATA 
CAGGTAGGGG TTTTCTTGGC TACGCCCTTT CAGCCTGTAA TTGCTCAAAC TTTACCTCCT 
TCTGGGCAAC TATTTCCTAC ACCTCCACCA GAGACGGAAG CTGTACCCCA GAATCCAAAT 
AACGAAACTT CTCCCCAATT TACCCGTTAC TTATTGGGAT CGGGTGATGT AATCAATGTC 
ACATTTCAAC GCCCACCTGG TGCTTACCGC TTGGGGCCGG GAGATGCAGT TAGCGTTGTT 
GTCCAACGCT TTCCAGATTT GAGTTTTCAA GCAGCAATTA ATCCAGAAGG CAATATCATA 
GTGCCGCTAC TGGAGACTGT TCCCCTACAA GGTTTAACCT TGCTAGAAGC ACAAGAAAAG 
ATTCGCTCTT TGCTGAATCG TTTTGTGATT AATCCTGTAG TAGTTTTATC TTTGTCTTCA 
CAGCGTCCAG ATGCAAGTTT TCAAGCCCAA GTGAATGCAG AAGGCAATAT TGTCGTTCCC 
CAGGTAGGAA TTGTATCTGT ACAAGGCTTA AGTTTGGAAG AAGCACAAGA AAAAATCCGT 
TTGAGTTTGA GCCAGATTCT TAATGATCCG CTTTTTGTCG TCACCCTAGC TAACCCGCGT 
CCAGTACAAA TTAGTATTAG TGGAGAGGTT TTCAGACCAG GTATTTATAA CTTGAATGCT 
GCACTACCCC GAATTGGGGA TGCGTTGCAA GTAGCGGGTG GTTCCACCAT TGGCGCAGAT 
TTGCGCCAAG TGCAAGTACG TCGGCGATTA GTTGATGGTT CGGCAATTTC GCAAACCATT 
GATTTATATG CCGCATTACA AAATGATGGC TCAATACCTA GTTTACGTTT GCAAGATGGC 
GATGCGTTAA TTATTCCCCG CCGCGAAATC GGCACAGACG ACGGTTATGA CCGCAATTTA 
GTAGCCCGTT CAACCTTGGC GACACCACAA ATTAGAGTCC GGGTATTGAA CTATGCTGCT 
GGTGGTCTTG TAACTCAAGC TTTGCCTAAT GGGAGTACTT TTATAGATGC ACTAGGTGGA 
ATTAATCTTG ATACTGCTAA CGTTAGGGAT ATTGCTTTAG TCCGTTTTGA CCCGGAACGT 
GGCAAGGCAG TTACACAAAG ACTAGATGGG AAAAAGGCTT TAGAAGGCGA TGTATCTCAG 
AATGTGCCAC TACAAGATAA TGATGTTATT GTAGTTGGAC GAAACTTGAT TGGCAGGATT 
ACAAATTTCC TCAGTACTAT TACCCAACCA TTCTTTAATG TCCGCTCATT TCTCAACTTC 
TTTGATACCT TTAGTCGGTA G

Protein sequence

MLIVFNDYMR AFCALSLVSI QVGVFLATPF QPVIAQTLPP SGQLFPTPPP ETEAVPQNPN 
NETSPQFTRY LLGSGDVINV TFQRPPGAYR LGPGDAVSVV VQRFPDLSFQ AAINPEGNII 
VPLLETVPLQ GLTLLEAQEK IRSLLNRFVI NPVVVLSLSS QRPDASFQAQ VNAEGNIVVP 
QVGIVSVQGL SLEEAQEKIR LSLSQILNDP LFVVTLANPR PVQISISGEV FRPGIYNLNA 
ALPRIGDALQ VAGGSTIGAD LRQVQVRRRL VDGSAISQTI DLYAALQNDG SIPSLRLQDG 
DALIIPRREI GTDDGYDRNL VARSTLATPQ IRVRVLNYAA GGLVTQALPN GSTFIDALGG 
INLDTANVRD IALVRFDPER GKAVTQRLDG KKALEGDVSQ NVPLQDNDVI VVGRNLIGRI 
TNFLSTITQP FFNVRSFLNF FDTFSR