Gene Ava_4554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4554
Symbol
ID	3680119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5706227
End bp	5707870
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	37%
IMG OID	637719910
Product	TPR repeat-containing protein
Protein accession	YP_325047
Protein GI	75910751
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.196541
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTGGA TTACGCTACT GCGATCGCTA CAGTCTGATT TTATTAAAAG GTTATCATCT 
GGTTGTCTGC TGCATTGCGA AATCGAAGGT CAATATAGTG AGTTAACAGT CATCTCTGGC 
GAAAGATTAA AAACCCTACG AGATTTTTGC TGGCTGATGG CTGAAAAATA CAAGCGGGTT 
TCGCCAGTTC GTGATGTTTT TATTAGCTAC CTCAAGGGGA AATTAGGTGA GGAAGTTGTT 
AAAGAACGTT TAGCTGATTT GATTACCGAA GTAGATTATG AGAAGCGGCT TGGTGGCGAT 
GGCAAGATAG ATTTTACTTT AACTGCTAAC CCTGCAATTG GCATTGAAGT TAAATCTCGT 
CATGGCAACA TTGATAGAGT GAGATGGTCA GTTAGTGCCG AAGAAGTGGA AAAAAATGCA 
GTTGTAGTTT GCATTTTTAT TAAAGAAGAT GTTAATGAAG CACAATCATC ATATCATCTG 
TTATTAGCTG GCTTTTTACC TACTCAAATG ATTAAATTAA AGACAGGTAA TATCTCATTT 
GGAATAGAGC AATTACTTTA TGGTGGCGGC TTATGGGGTT ATTTGGAACA GTTGCAAGCT 
TCCAGCAACT ATCATCAGTT CCAGCAATCT CCGCCAATTT ATGAATATCA ACCCCAGCCA 
GAATTTTCAA CTAAAATCAA TCAAAGTCAA TCAATCAAAC CAGCTTTATT TACTGGTATC 
AAAAATATTC TATCTTATAG ACGAGAAGAA GATATAAATA TAGATTATAT AAAACTTGGT 
GATGAGTGTT TTGCTCAAGG TGAATATACT GCATCTATTA AGAATTATAG CCAAGCTTTA 
CAAGCAAGTA GTAATAATGG TGAATTATAT TATAAACGAG GTTTAACTTA TTATCAATTG 
GGAGATTATG AGGCGGCGAT CGCTGATTAT TCTCAAGCCA TAAATCTCAA CTTTCACGAT 
GCTAAATCCT ATCATAAACG TGGCTTGGCT TTATCACAAC TAGCAGCTTA TGAAGCGGCA 
ATTGACGATT ATAACCAAGC AATTAGAATT AATCCTCATG CTGCTTCTAT TTATAAAAAC 
CGAGCAGAAG CACGCTCTCA TTTAGGAGAT AATCAAGGAG CGATTGAAGA TTATACCCAA 
GCGATCAAGA TTAATCCCCA ATATGCAGAT ACATATAAAA ATAGAGGCAT ATCTCGTTAT 
TTATTAGCAA CACAACCAGG ATTTACCCAA GCAATTAAGA TTAATCCCAA TGATGCTAAT 
GCTTACAAAA ATCGTGGTAA TGCGCGTGCT GATATTGGTG ATTATGCAGG AGCGATTGAA 
GATTATAATC AGGCAATCCA AATTAATCCC AAGGCGGCTG ATGCTTATTA TAACCGTGGT 
AACGCCCGTT ATGATTTAGG GGATGAAGAA GGAGCGATCG CTGATTACAC CCAAGCAATC 
CAAATTAATC CCAGCTATGC TGATGCTTAT TATAACCGTG GTAATGTGCG TGCAGGCATA 
AAAGATAAAC AAGGCGCGAT CGCTGACTTT CAAAAAGCAG CAGATATATA TCGTAAAGAA 
GGTAAATTAG CAGAACTCAA AGATGCAACA GAAAGAATTG TAGAATTGGA AATAGAAGAA 
TCCATTGATA TTTTAAATTT TTAA

Protein sequence

MDWITLLRSL QSDFIKRLSS GCLLHCEIEG QYSELTVISG ERLKTLRDFC WLMAEKYKRV 
SPVRDVFISY LKGKLGEEVV KERLADLITE VDYEKRLGGD GKIDFTLTAN PAIGIEVKSR 
HGNIDRVRWS VSAEEVEKNA VVVCIFIKED VNEAQSSYHL LLAGFLPTQM IKLKTGNISF 
GIEQLLYGGG LWGYLEQLQA SSNYHQFQQS PPIYEYQPQP EFSTKINQSQ SIKPALFTGI 
KNILSYRREE DINIDYIKLG DECFAQGEYT ASIKNYSQAL QASSNNGELY YKRGLTYYQL 
GDYEAAIADY SQAINLNFHD AKSYHKRGLA LSQLAAYEAA IDDYNQAIRI NPHAASIYKN 
RAEARSHLGD NQGAIEDYTQ AIKINPQYAD TYKNRGISRY LLATQPGFTQ AIKINPNDAN 
AYKNRGNARA DIGDYAGAIE DYNQAIQINP KAADAYYNRG NARYDLGDEE GAIADYTQAI 
QINPSYADAY YNRGNVRAGI KDKQGAIADF QKAADIYRKE GKLAELKDAT ERIVELEIEE 
SIDILNF