Gene Ava_C0023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_C0023
Symbol
ID	3677788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007412
Strand	-
Start bp	40106
End bp	41812
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	44%
IMG OID	637715107
Product	major outer membrane protein
Protein accession	YP_320301
Protein GI	75812684
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.500646
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0378832
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAATT ATTGGTTTGC AAATTTTCAT ATACTGGGTT GTTTGAGTGT TTTGAGCTTC 
GTCATCCTCA ATCATGCAAC TCCTTCCCTA GCCAAGACTG TTGAGTCTTT AACTTTTGAG 
GAAAAACAAG CAACAGAGGA TGTCCCTACA CTTTCTCCTG TTGTTCCAAC TTCAATTACT 
CAGCTAATTC ATCAAATTAT TCCTCAAGAA TCAGACGCAA CGCTACAAGG ACAAGTGACT 
TCAGTAAATC AACTGGATGA TGTTCAACCG ACAGATTGGG CATTTCAGGT GCTTCAGTCT 
TTGATCTCTC GATATAACAT TCTTACAGGC TATCCAGCCC AAACTTTTCG GGGCGATGTC 
TCACGACAAG CCGCTTTGCA TCTAAGAGCA ATGACTCGCG ACGAATTTGC ACTAGCATTG 
AACATAACAC TTAAACAAAT CAGCGAACAA ATTGCTCAAG GAACTGGTTC ACGAATATCT 
CGTGATGATT TAGAGACACT ACAACGACTT CAAGAAGAGT TTTCTGGCGA ACTCAGCACA 
CTACAAGAAC GTGTAGATGG ATTAGCAGCC CGAACTGCTA AGTTGGAAGC AAGTCAGTTC 
TCGACAACCA CCACATTCTC AGGAATAGTT GTATTTGGAG TCACTGGCGG AGGCTTTAGC 
GGCGATCGCA TTGTTGATGT CACAGGTAGA GAAATTGCGA CAAAAGATCC AAACCTTACA 
TTCCTTTACC GAGCTACCCT AGACTTCACT ACAAGTTTTA ATGGAACAGA TGCGCTAGAA 
CTCTGGCTGG AAATTGGCAG CAATGGGGCA GATGACAATG CAGCAGGATT GTTAGAACCC 
AGTTTTGGCA GCGTTTTAGA CTATTCAGCC AAACCCCCTG TTGAAGAGTT TGGCGTGTCC 
CGTCTGAATT ATACCTTTTC TCTATCTGAG GATTTGACGC TTTCCCTAGG CCCAGTCATC 
AGTCTTACTG ACTATGTAGA CTTAAACCGC TATGCAAATG TCAGTTTTCT AGACTTCTCT 
ACGCAAGCGT TGGTAAATAA CTATATTCTT TTCCCAGTTC AAGGGCTAGG AGCGGGTGCT 
GCTATCAGGT GGAATCCGAA TGAAGGCGCA TTTACGGCAC GAGCTGCTTA TGTGGCGGCA 
TCTGCGAGTC GGTCGAAAAT AGAGAGTTCA TCTCCAGTTC CTGGTATTTT CCCACTGGGA 
TACATTCTTT ATCCCAACGG ACGAGGAGAA GGAGGGCTGT TTGGCGATCC TTATCAAGGA 
ATCATTGAGT TAGAATACGC TCCTTCTAGA ATGTTTGCGC TACGCTTGCA ATATACGAGC 
GGTAGTATTT TAGGAGGGAA CTTTGATGTC TTTGGAGCCA ACTTGGAATT GACGCTTTCA 
GACCGTTTTG CTGTTTTTGG ACGCTACGGT TACGGTAGCT ACGCTGATAC TGCCTTTGGT 
GATTTAAAGC CTAGCTATTG GATGGCAGGT GTAGCTTTTC TGGATCTATT CATTGAAAAT 
GCTCTGGCAG GCATAGCTGT AGGTCAGCCG TTTATCGCAA GTGAAATAGG AGATTCAACA 
CAAACGAATT TCGAGGCTTT CTACAATTTT CCAATTAATG ACAATATCCG TGTCACACCT 
GTATTTCAAG TGATTACAAA TCCAGCTAAT CAAAGCGTCA ATGGCACAAT CCTTACAAGT 
ACACTCCGCA CCGTCTTCTC GTTCTAA

Protein sequence

MQNYWFANFH ILGCLSVLSF VILNHATPSL AKTVESLTFE EKQATEDVPT LSPVVPTSIT 
QLIHQIIPQE SDATLQGQVT SVNQLDDVQP TDWAFQVLQS LISRYNILTG YPAQTFRGDV 
SRQAALHLRA MTRDEFALAL NITLKQISEQ IAQGTGSRIS RDDLETLQRL QEEFSGELST 
LQERVDGLAA RTAKLEASQF STTTTFSGIV VFGVTGGGFS GDRIVDVTGR EIATKDPNLT 
FLYRATLDFT TSFNGTDALE LWLEIGSNGA DDNAAGLLEP SFGSVLDYSA KPPVEEFGVS 
RLNYTFSLSE DLTLSLGPVI SLTDYVDLNR YANVSFLDFS TQALVNNYIL FPVQGLGAGA 
AIRWNPNEGA FTARAAYVAA SASRSKIESS SPVPGIFPLG YILYPNGRGE GGLFGDPYQG 
IIELEYAPSR MFALRLQYTS GSILGGNFDV FGANLELTLS DRFAVFGRYG YGSYADTAFG 
DLKPSYWMAG VAFLDLFIEN ALAGIAVGQP FIASEIGDST QTNFEAFYNF PINDNIRVTP 
VFQVITNPAN QSVNGTILTS TLRTVFSF