Gene Ava_4824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4824
Symbol
ID	3679400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	6060462
End bp	6062138
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	44%
IMG OID	637720181
Product	Beta-Ig-H3/fasciclin
Protein accession	YP_325316
Protein GI	75911020
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2335] Secreted and surface protein containing fasciclin-like repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.597464
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.196528
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAGTT CGGTTCGACG GTCACTAGCC TACACAACTT TGCTGGCTTT GGGGATGACA 
GCTATAACAA TAAATCCCTT AATAGTTTCT AAACCAGCTT CAGCACAAAC ACCTGTCCCT 
ACAGAAACTC CGTCTACTAC AGGTTCCAAC TTTTCTGATG TCAGTTCAGA TTACTGGGCG 
CAACCATTTA TTCAAGCTTT AGCGCAAAGA AATATCATTG CTGGTTTTCC CGATGGTACT 
TTTAGACCAA ACCAGGCAGT AAGTCGCGCT GAGTTTGCCA CATTAATTCA GAAAGCTTTT 
AATCAACAAC CGGTCCGACA ATTAAGTGCA TCTGGATTTA CAGATGTACC TGCAAATTTC 
TGGGCATCGC AAGCAATTCG GGAAGCTTAC GAAACGGGAT TTCTCTCCGG CTATCCAGGG 
AATGTGTTTC GCCCCAATCA ACAGATTCCT AGAGTACAGG CGATCGTTGC TTTAAGCAGT 
GGTTTAAACT TAACTACAAC TGATACTGCG TCAAATATTC TCAGCAATAA CTATGCAGAT 
GCTTCGGCAA TTCCTGACTA TGCTGTCAAC GGCGTAGCCG CAGCAACACA AAGCAACATA 
GTTGTTAACT ACCCAAATGT AAGAGAACTG AATCCCTCAA CATCTCTTAC CCGTGGGGAA 
GCTGCCGCAA TTTTGTATCA AGCTTTAGTT CGACAAGGAC AAGTACAACC TCTACCTAGC 
AATGTTGCAG CTGCTAACTA CGTAGTGGGT GGGACTGGTA CAACAGGAGG TACACAAGGT 
GCTAATAATA TTGTTGCTTT GGCAGCATCA AGTAACTCTT TTAGTACCTT GACTTCTTTA 
TTGAGAACCG CAGGTTTAAC AGATATTCTA GAGCAACCAG GGCCTTACAC AGTCTTTGCT 
CCCACCAATG AAGCATTTGC AGCGTTACCT GCGGGTACTT TAGAACAACT GCAACAACCA 
CAGAACAGAG AGTTGTTGGT GAGAATTTTG CGCTATCATG TGGTTCCTGG TCAATTAACT 
GCTAACCAAC TCTCTTCTGG ACAACTGACA ACTGCTAGCG ATGCACCAGT CAATGTGAGA 
GTTGACACAG CCAATAATCA AATTGCCGTT AATGAGGCGA GAGTTGTTCA AGCAAATATT 
CAAGCTAGCA ATGGTGTTAT CCATGCTATT AACGAAGTCC TGATTCCACC TAATTTAACT 
GGTCAGCAGC CGCAAGAAGG AACCCCTCAA GCACAAAATC CGGGTGCTGT CACTCCAGGT 
AGAGCTACCC GTGGCGGTTC TAGTTACATA GGGGTTGCTG GTAACATTGG TTTAGGTGGT 
GATACAGCTC TCAGCGATAG CAACTTTGCA GTTATCAGTA AAGTTGGTTT GACACGCAAT 
CTATCAGTCC GACCATCAGC TGTTTTTGGT AACGATACGG TATTTCTAGT GCCGTTGACC 
TTGGATTTCA CACCCCGCGC AGTAGAGCCT GGTGTTGTGC AGCCATTCGC CGTATCACCT 
TATGTTGGTG CTGGTGTAGC AATCGAAGCT AGTGGCGACA CTGATATTGG TTTACTGTTA 
ACTGGTGGTG TTGATATTCC TTTAGGACAG AGATTTACCA TTAATGGTGC TGTTAATGCA 
GCTTTTGTAG ATGAAACTGA TGTTGGTTTG CTATTAGGTA TTGGCTACAA TTTTTAG

Protein sequence

MFSSVRRSLA YTTLLALGMT AITINPLIVS KPASAQTPVP TETPSTTGSN FSDVSSDYWA 
QPFIQALAQR NIIAGFPDGT FRPNQAVSRA EFATLIQKAF NQQPVRQLSA SGFTDVPANF 
WASQAIREAY ETGFLSGYPG NVFRPNQQIP RVQAIVALSS GLNLTTTDTA SNILSNNYAD 
ASAIPDYAVN GVAAATQSNI VVNYPNVREL NPSTSLTRGE AAAILYQALV RQGQVQPLPS 
NVAAANYVVG GTGTTGGTQG ANNIVALAAS SNSFSTLTSL LRTAGLTDIL EQPGPYTVFA 
PTNEAFAALP AGTLEQLQQP QNRELLVRIL RYHVVPGQLT ANQLSSGQLT TASDAPVNVR 
VDTANNQIAV NEARVVQANI QASNGVIHAI NEVLIPPNLT GQQPQEGTPQ AQNPGAVTPG 
RATRGGSSYI GVAGNIGLGG DTALSDSNFA VISKVGLTRN LSVRPSAVFG NDTVFLVPLT 
LDFTPRAVEP GVVQPFAVSP YVGAGVAIEA SGDTDIGLLL TGGVDIPLGQ RFTINGAVNA 
AFVDETDVGL LLGIGYNF