Gene Ava_3656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3656
Symbol
ID	3679251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	4561489
End bp	4562772
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	45%
IMG OID	637719007
Product	twin-arginine translocation pathway signal
Protein accession	YP_324157
Protein GI	75909861
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAAGT TGAACAGGCG ACAATTTATC ACAACTGCGG GTGCAGCTGC ACTGACTCAT 
GCCACTATTG CCAAAACTCA GTTACATTCC GGCGTTTATG CTGGCTATAG TGATACTCCA 
GAAGTAACCA CAGCCACACT GGGATTTTTA CCTGTTACTA GCTGCTGTCC TTTAATTATT 
GCCAAAGCCA AAGGCTTTTT TGCTAAACAT GGAATGCCCG ATATTAATGT TGTCAAACAA 
CCTTCCTGGG CAGTCATGCG CGACAAACTC ATGTTAGGTG CAGCCGATGA GGGGTTAGAT 
GGTGGGCATT TGCTGTTTCC GATGGTGTAC CTCATGGCTA CCGGGGAAAT TAGCTATGGG 
CGAAAAATCC CCATGTATAT CTTGGCCAGA ATGAATGTGA ACGGACAAGG GATATCAGTT 
GCTAATAGCT ACAAAAATTT AAACCTGAGT ATAGATAGTT CTCCCTTAAA ATCAGCCTTT 
GCCCAAAAAA CGAAAGCTGG AGAAACTGTG CGTTGTGCAG TACCTTATCG TCGGGTAACG 
GGTGATTTTT TTATGCGTTG GTGGTTGGCT TATGGTGGAA TAGATCCAGA CCGTGATTTA 
TCAGTAATTG TGATTGCACC TCCACAGATG GTTGCGAGTA TGCGTAGTGG CAGCATGGAA 
GCCTTCTGTG TAGTTGACCC TTGGCATCAC CGATTGATTA AACAAGGGCT TGGTTACTCA 
ACTGTGACAA CTGGTGAGTT GTGGCCTAAT CACCCAGAGA AAGCCTTTAC TGTACGTGCT 
GAGTGGGTGG ATAAATATCC CAAGGCGGCA AAAGCGATGC TGGCGGCATT TTTAGAGGCG 
CAAATCTGGT GTGATAAGCC AGAAAATAAA GAGGAACTAT TCCAAATAGT GTCACAACGG 
CAATGGATTG GCGTGAAAAG TGACTTGATC CGCGATCGCC TCTTAGGTAA ATTTGATTAT 
GGTAATGGGC GGATAGTGGA AAATAGCCCC CATGCCATCA AATACTGGCG GGAAAATGCT 
TCCTATCCTT TCAAGAGTCA TGATTTATGG TTTCTCATTG AAGATATGCG CTGGGGTTAT 
CGTTCCCCCG ATTTTGATAC CAAACCCCTA ATTGATGCCG TCAATCGTGA AGATTTGTGG 
CGAGAAGCTG CTAAGTTCAT AGGTCAAGAG TCAGCGATTC CCGCCAGTAC ATCACGGGGG 
GTAGAAAAAT TCTTTAATGG CTTAGAATTT AATCCAGAAA ATCCCCTAGC TTATCTCAAT 
GCGCCCAAGA TCAGGATAAT GTGA

Protein sequence

MPKLNRRQFI TTAGAAALTH ATIAKTQLHS GVYAGYSDTP EVTTATLGFL PVTSCCPLII 
AKAKGFFAKH GMPDINVVKQ PSWAVMRDKL MLGAADEGLD GGHLLFPMVY LMATGEISYG 
RKIPMYILAR MNVNGQGISV ANSYKNLNLS IDSSPLKSAF AQKTKAGETV RCAVPYRRVT 
GDFFMRWWLA YGGIDPDRDL SVIVIAPPQM VASMRSGSME AFCVVDPWHH RLIKQGLGYS 
TVTTGELWPN HPEKAFTVRA EWVDKYPKAA KAMLAAFLEA QIWCDKPENK EELFQIVSQR 
QWIGVKSDLI RDRLLGKFDY GNGRIVENSP HAIKYWRENA SYPFKSHDLW FLIEDMRWGY 
RSPDFDTKPL IDAVNREDLW REAAKFIGQE SAIPASTSRG VEKFFNGLEF NPENPLAYLN 
APKIRIM