Gene Ava_2778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_2778
Symbol
ID	3681711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	3432126
End bp	3433355
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	43%
IMG OID	637718124
Product	Integrins alpha chain
Protein accession	YP_323286
Protein GI	75908990
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGAAA CGCAAAGCTT TTCCAAGAGA ATAGATAATT CGCTTAATAC ATCTTTTGCA 
AGATCAGCAT CTTTGGTATC GAGTGCTTAT GTAAGTGATT TAAATACTGA GCTACCATCA 
TCTAGTAATA GCTCTGCAAC AACACAAGTA GATTTGCCAA TTTCCATTCC TGGTTTGAGT 
GCCAACCCAA ATCCTAATCC TTACTTAACT AGCGCAGCAA TTTCACCTGA TTTCAACGGC 
GATGGTAAGG CAGATAAGGT TTGGGTTAAT ACTCAAACAG GTGAAATTAG AGTGAGGTTG 
ATGAACGGAA CAGTCACTCA AGAAGAAGCC TCTTTAGGAA CATTTGATCT GAGTGTCTGG 
ACTTATAAAA TCGCTGACTT TAACAGTGAT GGCAAGACTG ACTTCCTGTT ACGGAACAAT 
GCAACAGGCG AGAATGCGAT TGCGATCATG GATGGAGCTA GAGTTGCTAA CTTTGTTTAT 
CTAGACAAAG TTGATCCAGG TTGGAATGCT AGCATCGGTG ATTTTAACGG CGATCGCAAA 
ACCGACATCC ACTGGAATAA TACTCAAACA GGTGAAAATG CAATTTGGCT GATGGATGGC 
ACAACCGTTG TCAGTGCCAA TGTTCTGGAT ACCACAACCC CAGGGTTGAG TGCCACTATT 
GTTGACTTCG ACGGAAACGG TAAGAGTGAT ATCTTCTGGC GAGATACAAC CACAGGTGCA 
AACTCCGTTT GGTTTATGGA TGGTATCCAA GCTACCAAGT ATGATCTACA AGCACAAGAC 
GCATCTTGGT CTTACAGCCT TGGCGATTTC AACGGTGACT TCACTACTGA TCTTCTCTGG 
CGTAATACCG TCACTGGTGA AAACAAAATT TGGACAATGA ATGGCATTTT TGTCACTGAA 
GGTACTTTAA ACACCCTCAG TTCCGATTGG ACAGCCAACA TTGGTGATTT CAATGGTGAT 
GGCCGCACCG ATATCTTCTG GAACAACACT ACAACTGGTG CAAACACTGC TTGGTTAATG 
AATGGTACAT CCGTTACCAG TGAAGCCTTT CTACCAAGTA GAAGTCCAGG TTCTAAGGCG 
TATATTGGCG ATTATAACAG CGATGGCAAA TCTGATATTT ACTGGCGTGA TCAGGCAACC 
GGTACAGATG CCATCTGGAC TATGGATGGT ACCTTGGCTA CTGAAACTCC TGTTACAGAT 
GCTCTGACTC CAGAGTGGTA CACAGCTTAG

Protein sequence

MQETQSFSKR IDNSLNTSFA RSASLVSSAY VSDLNTELPS SSNSSATTQV DLPISIPGLS 
ANPNPNPYLT SAAISPDFNG DGKADKVWVN TQTGEIRVRL MNGTVTQEEA SLGTFDLSVW 
TYKIADFNSD GKTDFLLRNN ATGENAIAIM DGARVANFVY LDKVDPGWNA SIGDFNGDRK 
TDIHWNNTQT GENAIWLMDG TTVVSANVLD TTTPGLSATI VDFDGNGKSD IFWRDTTTGA 
NSVWFMDGIQ ATKYDLQAQD ASWSYSLGDF NGDFTTDLLW RNTVTGENKI WTMNGIFVTE 
GTLNTLSSDW TANIGDFNGD GRTDIFWNNT TTGANTAWLM NGTSVTSEAF LPSRSPGSKA 
YIGDYNSDGK SDIYWRDQAT GTDAIWTMDG TLATETPVTD ALTPEWYTA