Gene Ava_1507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1507
Symbol
ID	3682473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	1853989
End bp	1855518
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	50%
IMG OID	637716847
Product	photosystem antenna protein-like
Protein accession	YP_322025
Protein GI	75907729
COG category
COG ID
TIGRFAM ID	[TIGR03039] photosystem II chlorophyll-binding protein CP47

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000000124352
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACTAC CCTGGTACCG AGTACATACA GTAGTTCTGA ATGACCCAGG GCGACTGATT 
TCTGTACACT TGATGCACAC AGCCCTGGTG GCAGGTTGGG CTGGTTCGAT GGCACTATAC 
GAACTAGCTA TTTATGACCC CAGCGATCCG GTTCTCAACC CGATGTGGCG GCAAGGGATG 
TTCGTGCTAC CCTTCATGGC ACGGTTAGGA GTTACCCAAT CTTGGGGCGG TTGGAGCGTT 
ACTGGTGGTA CAGCAACTGA CCCTGGCTTC TGGTCATTTG AAGGGGTTGC CGCAGCCCAC 
ATCGTGCTTT CTGGTTTATT ATTCCTAGCT GCCGTTTGGC ACTGGGTTTA CTGGGATTTG 
GAACTCTTTA GAGATCCTCG TACCGGTGAA CCTGCGCTAG ATTTGCCAAA AATGTTTGGC 
ATTCACCTGT TCTTATCCGG TTTACTCTGT TTCGGCTTTG GTGCTTTCCA CCTCACAGGC 
TTATTCGGCC CTGGAATGTG GATTTCTGAC CCCTATGGAG TCACAGGTAG CGTCCAGCCA 
GTAGCGCCCG AATGGGGTCC AGATGGGTTT AACCCATTTA ACCCTGGTGG CGTAGTAGCT 
CACCACATTG CGGCTGGGAT TGTCGGTATC ATTGCTGGTT TATTCCACCT CACTGTCAGA 
CCCCCCGAAA GGCTTTACAA AGCTTTACGG ATGGGTAACA TTGAAACCGT ACTTTCCAGC 
AGTATCGCCG CAGTATTCTT CGCAGCTTTC GTAGTTGCAG GAACCATGTG GTACGGCAAC 
GCTACTACAC CCATCGAACT GTTTGGACCC ACACGCTATC AATGGGATCA AGGCTACTTC 
CATCAAGAAA TTGAGCGCCG TGTACAATCA AGCGTAGCTC AAGGTGCAAG TCTTTCCGAA 
GCTTGGTCAC AGATTCCCGA AAAACTAGCT TTCTATGATT ACGTCGGTAA CAGCCCCGCT 
AAAGGTGGTT TGTTCCGTAC AGGGCCAATG GTTAAGGGTG ATGGTATTGC CCAATCTTGG 
CAAGGTCACG GAGTATTCAA AGATGCTGAA GGCCGGGAAT TGACAGTACG TCGTCTGCCC 
AACTTCTTTG AAACCTTCCC AGTAATCTTG ACAGATGCTG ATGGTGTTGT CCGCGCTGAC 
ATCCCCTTCC GTCGAGCAGA ATCCAAGTAT AGCTTTGAAC AATCAGGCGT AACAGTTAGC 
TTCTACGGTG GCGATTTGGA CGGTAAAACC TTTACTGATC CCGCCGATGT GAAGAAATAC 
GCCCGTAAAG CTCAAGGTGG AGAAATATTT GAATTCGACC GCGAAACCTT AAACTCTGAC 
GGTGTATTCC GTACATCCCC CAGAGGTTGG TTTACCTTTG GTCACGCTGT ATTTGCTTTG 
TTATTCTTCT TTGGCCACCT CTGGCACGGC GCTCGGACAA TATACCGAGA CGTATTCGCC 
GGTGTGGAAG CCGATCTAGA AGAACAAGTA GAGTGGGGTC TATTCCAGAA AGTGGGTGAC 
AAATCAACCC GCGTCCGGAA GGAAGCTTAA

Protein sequence

MGLPWYRVHT VVLNDPGRLI SVHLMHTALV AGWAGSMALY ELAIYDPSDP VLNPMWRQGM 
FVLPFMARLG VTQSWGGWSV TGGTATDPGF WSFEGVAAAH IVLSGLLFLA AVWHWVYWDL 
ELFRDPRTGE PALDLPKMFG IHLFLSGLLC FGFGAFHLTG LFGPGMWISD PYGVTGSVQP 
VAPEWGPDGF NPFNPGGVVA HHIAAGIVGI IAGLFHLTVR PPERLYKALR MGNIETVLSS 
SIAAVFFAAF VVAGTMWYGN ATTPIELFGP TRYQWDQGYF HQEIERRVQS SVAQGASLSE 
AWSQIPEKLA FYDYVGNSPA KGGLFRTGPM VKGDGIAQSW QGHGVFKDAE GRELTVRRLP 
NFFETFPVIL TDADGVVRAD IPFRRAESKY SFEQSGVTVS FYGGDLDGKT FTDPADVKKY 
ARKAQGGEIF EFDRETLNSD GVFRTSPRGW FTFGHAVFAL LFFFGHLWHG ARTIYRDVFA 
GVEADLEEQV EWGLFQKVGD KSTRVRKEA