Gene Ava_4841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4841
Symbol
ID	3679339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	6093465
End bp	6094589
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	41%
IMG OID	637720198
Product	glycosyl transferase, group 1
Protein accession	YP_325333
Protein GI	75911037
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000142373
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0561788
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTAAAT ATCGAATTAA AGTCGTTTTA TTACATTTTT CTTTTAGTGA ATATACTGTT 
CAATTGGCAA ATAATTTAGT TAAATATGTT GATTTAACAC TGATACATTC AGAAGAAATA 
TATAGGCAAT GCAAAGATGT TCTTAATCCT CATATTCGAG TGATTCAAAT TAAGAAACCC 
CGCATTCGTG ATCCTCGCAA CATTAAGGTG ATAGCAGCAA TGATGCGAAT GATTCGAGAG 
ATAAACCCTG ATGTACTCCA TGTTCAAGAA ACTAACGATC CTTGGTATGA TTTAACTCTT 
TTATTCAGTA AAATGCCCCC TCTGGTAACT ACAATTCATG ATGTATATCG TCACCCAGGC 
GATCGCGATT TAACACCGGG CGCTGAATAT ACTCGCAGAA TAGCTTTCTA CCGTTCCCAG 
CAATTAATTG TCCACTCCCA GTCACTTCAA GATATCCTCA TCAAACAGTT CCGCTTACCT 
CAACAGCGAA TTAACGTCCT ACCTCACGGA GAGTTAGGTA GTTTGTTTCA AAGTTGGTCA 
AGTGGTCAAA TAGCACCTCG TGAGCCTCAT ACATTACTAT TTTTCGGGCG TATCTGGCCA 
TACAAGGGTC TAAAATACTT GCTGCAAGCT ATCCCCTTAG TTGCAGAACA CATCCCCGGA 
GTCAAACTTA TCATTGCTGG ACGGGGAGAA AATGTCAGTG AATTATTGCA GGATGCAGAC 
AAAAAACACT ACGAAATTCT CAATAACTTT ATCCCTACCG GAAATGTCGC CAATTTATTT 
CAACGAAGTG CGGCTGTTGT TCTACCTTAC ATTGAATCTT CACAAAGCGG TGTAGCAGCG 
ATCGCCTATG CGATGGGTAC TCCTGTAATT GCTTCTAATA TTGGCGGTTT GAGGGAAATA 
GTCCGACATG AACAAGACGG ACTGCTAGTA CCACCGTGTG ATGTCCAGTC TCTTGCAGAT 
GCAATCATTC GGCTATTAAG TGACTCTCAC TTACAACGTC AGATGCAAAT CGCCGCATTA 
GAGCGTTGTC AACAAGACTT GAACTGGTCA AACATTGCAG CTCAAACAAT CGAAGTTTAC 
CATCAAGCGA TCGCCGCCAA AAGTACATCT TTGATGACCA GATGA

Protein sequence

MGKYRIKVVL LHFSFSEYTV QLANNLVKYV DLTLIHSEEI YRQCKDVLNP HIRVIQIKKP 
RIRDPRNIKV IAAMMRMIRE INPDVLHVQE TNDPWYDLTL LFSKMPPLVT TIHDVYRHPG 
DRDLTPGAEY TRRIAFYRSQ QLIVHSQSLQ DILIKQFRLP QQRINVLPHG ELGSLFQSWS 
SGQIAPREPH TLLFFGRIWP YKGLKYLLQA IPLVAEHIPG VKLIIAGRGE NVSELLQDAD 
KKHYEILNNF IPTGNVANLF QRSAAVVLPY IESSQSGVAA IAYAMGTPVI ASNIGGLREI 
VRHEQDGLLV PPCDVQSLAD AIIRLLSDSH LQRQMQIAAL ERCQQDLNWS NIAAQTIEVY 
HQAIAAKSTS LMTR