Gene Ava_4163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4163
Symbol
ID	3681103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5211297
End bp	5212415
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	45%
IMG OID	637719510
Product	binding-protein dependent transport system inner membrane protein
Protein accession	YP_324657
Protein GI	75910361
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0546516
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.0000167593
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATTGGT GGCAAAGACT TCAGAAAAAT CCTTTAGCGC AATTTGGGGC TATTTTACTT 
TTAATATTTT ATTTGGCGGT GATTGCGGCT GATTTTATCG CTCCATACGA CCCTTACACT 
TCTCAACCGA ATGGTTCGCT ATTACCGCCA ACTAAGATTT ATTGGGTTTC AAAAACATCA 
GGTAAGTTTA TCGGCCCCCA CGTTTATCCC ACAACACAAG GTAATACAGA CTTAGAAACA 
GGCGATCGCC AACTCATTGT AGACGATAAA AAGCCCTCAC CTGTGCGTTT CTTTGTCTCT 
GGGCCAGAAT ACCGACTGTT ACAGCTAAGT TTACCCCTAC CCCCCAAGTG GGAAGAAACC 
ACAATTATCC CCGGTATCCC CTTAAATTGG CATTTATTCG GTGCAGATAA TGGGGCAAAA 
CTCAACATCT TAGGTACGGA CGAACAAGGC CGCGACCAAT TTAGCCGCCT CCTACATGGT 
GGACGCATTA GTATGTTTAT CGGCATTATT GGGGTGGTAA TTACTTTTCC CCTCGGTTTG 
CTAATAGGGG GAATTTCCGG CTATTTCGGT GGTTGGACGG ACAGCATTAT TATGCGGATT 
GCAGAAGTGC TGATGACTTT CCCCAGTATT TATCTGTTAG TTACCTTGGG GGCAGTTTTA 
CCGGCTGGTT TAACTAGCAG TCAGCGATTT TTACTCATAG TTTTGATCAC CTCTGTAATT 
AGCTGGGCTG GGTTAGCCAG GGTAATTCGT GGACAAGTGC TGTCAATCAA AGAACGAGAA 
TTTGTCCAAG CCGCCAGGGC TATGGGTGGT AAGCCAATAT ATATTATTCT GCGTCATGTT 
CTGCCGCAAA CTGCTACTTA TGTAATTATC TCTGCTACTT TGGCGGTTCC TAGCTTTATC 
GGTTCAGAAG CAATACTCAG TCTCATCGGT TTAGGCATCC AACAACCAGA CCCATCTTGG 
GGTAATATGC TATCTCTAGC TAGCAATGCT TCCATATTAG TGCTGCAACC TTGGTTAATT 
TGGCCGCCAG CCGTGTTAAT TATTTTGACA GTTTTAGCTT TTAATTTACT CGGTGATGGC 
CTTAGGGATG CCCTTGATCC TCGGAGTTTA CGCCGCTAG

Protein sequence

MNWWQRLQKN PLAQFGAILL LIFYLAVIAA DFIAPYDPYT SQPNGSLLPP TKIYWVSKTS 
GKFIGPHVYP TTQGNTDLET GDRQLIVDDK KPSPVRFFVS GPEYRLLQLS LPLPPKWEET 
TIIPGIPLNW HLFGADNGAK LNILGTDEQG RDQFSRLLHG GRISMFIGII GVVITFPLGL 
LIGGISGYFG GWTDSIIMRI AEVLMTFPSI YLLVTLGAVL PAGLTSSQRF LLIVLITSVI 
SWAGLARVIR GQVLSIKERE FVQAARAMGG KPIYIILRHV LPQTATYVII SATLAVPSFI 
GSEAILSLIG LGIQQPDPSW GNMLSLASNA SILVLQPWLI WPPAVLIILT VLAFNLLGDG 
LRDALDPRSL RR